Pour partager ses données avec un large public, la solution la plus efficace est de les déposer dans un entrepôt de données. La première recommandation consiste à chercher s’il existe un entrepôt disciplinaire adapté à votre type de données ou à votre thématique de recherche.
De nombreux entrepôts de données existent dans le domaine des neurosciences. Nous en avons sélectionné trois pour lesquels nous vous proposons un comparatif : EBRAINS, DANDI et OpenNeuro.
Quels sont leurs points communs ? Ils sont gratuits, le volume des jeux de données n’est pas limité et ils attribuent tous les trois des DOI aux jeux de données publiés. Et voici maintenant leurs principales différences :
Qui développe, héberge et finance l’entrepôt ?
- EBRAINS est soutenu par des institutions européennes à but non lucratif.
- DANDI et OpenNeuro sont soutenus par des institutions américaines (majoritairement à but non lucratif, une entreprise privée est impliquée dans le développement de DANDI). Notons que ces deux entrepôts indiquent sur leur page d’accueil qu’ils font actuellement l’objet d’un examen en vue d’une éventuelle modification conformément aux directives de l’administration fédérale américaine.
Quels types de données sont acceptés ?
- EBRAINS accepte tous types de données en neurosciences (microscopie, électrophysiologie, comportement, etc.), à condition qu’elles soient correctement décrites et organisées (sans nécessairement être structurées selon un standard précis).
- DANDI permet le partage de données de neurophysiologie (électrophysiologie, optophysiologie, séries temporelles comportementales, images d’expériences d’immunomarquage) structurées selon le standard NWB (Neurodata Without Borders).
- OpenNeuro permet le partage de données de neuro-imagerie (IRM, tomographie par émission de positons, électroencéphalographie, magnétoencéphalographie…) structurées selon le standard BIDS (Brain Imaging Data Structure).
L’entrepôt assure-t-il une curation des jeux de données pour s’assurer qu’ils sont correctement décrits et réutilisables ?
- Dans EBRAINS, la curation est assurée par des neuroscientifiques qui accompagnent les déposants tout au long du processus de dépôt (organisation et description des données). Ils veillent également à ce que le jeu de données soit correctement relié aux autres ressources décrites dans EBRAINS (projets, contributeurs, etc) afin de constituer le graphe de connaissances EBRAINS.
- DANDI et OpenNeuro n’assurent pas la curation des jeux de données.
Comment se déroule le dépôt des données ?
- Le processus de dépôt dans EBRAINS peut être assez long, notamment en raison des échanges avec le curateur. Il comprend plusieurs étapes de description du jeu de données : ajout de métadonnées selon le standard openMINDS et rédaction d’une documentation sous la forme d’un « Data Descriptor ».
- Le dépôt de données dans DANDI et OpenNeuro est très simple si les données sont correctement structurées selon les standards NWB ou BIDS respectivement. Certaines métadonnées sont directement extraites des fichiers NWB et BIDS et il suffit de compléter la description manuellement dans l’entrepôt avant de publier le jeu de données.
Quelles sont les possibilités offertes par l’entrepôt concernant les conditions d’accès et la licence à associer au jeu de données ?
- EBRAINS permet de partager ses données en accès ouvert, sous la licence Creative Commons de son choix. Par ailleurs, certaines données liées à l’humain peuvent être partagées en accès restreint.
- DANDI a la particularité de ne pas permettre d’accès privé au jeu de données avant sa publication : dès lors qu’un jeu de données est créé, il est immédiatement accessible à tous, en version draft, sous licence CC0 ou CC BY. La seule différence avec un jeu de données publié est l’attribution d’un DOI au moment de la publication.
- Dans OpenNeuro, tous les jeux de données sont en accès ouvert sous licence CC0.
Ce comparatif est publié dans un contexte incertain aux États-Unis, où certaines bases de données sont censurées ou supprimées. L’utilisation de DANDI et d’OpenNeuro est donc actuellement déconseillée, mais nous tenions à vous présenter ces deux entrepôts. Ils sont en effet de bons exemples d’entrepôts développés spécifiquement pour un standard de données, intégrant des validations automatiques de fichiers et une récupération automatique de métadonnées. Ils démontrent ainsi l’intérêt de standardiser les données le plus tôt possible, car cela facilite non seulement leur gestion au quotidien, mais aussi leur partage.


