Comment faire

Comment trouver un entrepôt de données dans le domaine biomédical ?

[Mise à jour d’un article initialement publié en janvier 2021]

Pour partager ses données à un large public, la solution la plus efficace est de les déposer dans un entrepôt de données. Mais comment trouver un entrepôt de données adapté à ses besoins ? Selon quels critères le choisir ?

La première recommandation est de chercher en premier lieu s’il existe un entrepôt disciplinaire adapté à votre type de données ou à votre thématique de recherche. Ensuite, si vous n’en trouvez pas, le choix s’oriente vers un entrepôt généraliste comme Recherche Data Gouv ou Zenodo.

Pour identifier un entrepôt disciplinaire qui pourrait convenir, nous vous conseillons :

  • De vous renseigner auprès de votre communauté scientifique sur les entrepôts les plus utilisés dans votre domaine.
  • De regarder dans ResearchDataWiki pour voir si votre type de données s’y trouve. En cliquant dessus, vous trouverez des propositions d’entrepôts adaptés à ce type de données.
  • De faire une recherche par sujet dans le répertoire re3data (on vous le présente ici). Vous pouvez naviguez dans l’arborescence et sélectionner votre thématique de recherche (Shift + clic) pour afficher les entrepôts correspondants.

Une fois que vous avez identifié un entrepôt intéressant, il vous faut vérifier si ses caractéristiques et fonctionnalités répondent à vos besoins et s’il permet de rendre vos données FAIR. Pour cette analyse, nous vous recommandons d’utiliser les informations fournies par re3data et de les compléter par celles d’un autre répertoire : FAIRsharing.

Voici quelques questions que nous vous conseillons de vous poser et la façon de trouver l’information dans ces deux répertoires :

  1. L’entrepôt permet-il le dépôt de données ?

Dans FAIRsharing, regardez le champ Type : si la mention Knowledgebase est indiquée, le dépôt de données ne sera pas possible.

  1. L’entrepôt est-il certifié ?

Les entrepôts certifiés sont à privilégier, ils sont en effet considérés comme des entrepôts « de confiance » répondant aux principes FAIR.

Dans re3data, vérifiez si la 5e icône est rouge. Si c’est le cas, le type de certification est indiqué sous l’onglet General dans la section Certificates and Standards.

  1. L’entrepôt de données est-il non commercial ?

Dans re3data, sous l’onglet Institutions, vérifiez que les institutions ayant la responsabilité General ou Technical sont non-commerciales (non-profit).

  1. L’entrepôt correspond-il à vos besoins pour ce qui est de l’accessibilité aux données ?

Selon les situations et types de données, vous pouvez avoir besoin que les données soient en accès ouvert, restreint ou fermé, ce qui n’est pas possible dans tous les entrepôts : pour certains, les données sont en accès ouvert obligatoirement, d’autres proposent uniquement un accès restreint, d’autres vous permettent de choisir le niveau d’accès souhaité.

Dans re3data, sous l’onglet Terms, dans la section Data access, vérifiez quelles conditions d’accès aux données sont possibles : accès ouvert, restreint, après embargo…

  1. Des identifiants uniques et pérennes (DOI par exemple) sont-ils attribués aux jeux de données ?

La plupart des entrepôts attribuent des identifiants uniques aux jeux de données, mais ils ne sont pas nécessairement pérennes.

Pour vérifier si l’identifiant est pérenne, dans re3data, regardez si la 4e icône est bleue. Sous l’onglet Standards, le type d’identifiant est indiqué en premier.

  1. La licence sous laquelle les données seront accessibles est-elle clairement mentionnée ou l’utilisateur peut-il choisir une licence ?

Certains entrepôts imposent la licence alors que d’autres vous laissent le choix.

Dans re3data, sous l’onglet Terms, vérifiez si une ou plusieurs licences sont indiquées dans la section Data licenses.

  1. Quelles métadonnées sont demandées au moment du dépôt ? S’agit-il d’un standard de métadonnées ?

Dans FAIRsharing, dans la section Related Content, l’onglet Related Standards indique les standards de métadonnées, ontologies et formats standards mis en œuvre par l’entrepôt. Cherchez également sur le site web de l’entrepôt si vous pouvez accéder à la liste des métadonnées qui sont demandées au moment du dépôt (template, checklist…).

  1. L’entrepôt correspond-il à vos besoins pour ce qui est du volume des données déposées ?

Certains entrepôts imposent un volume maximal pour chaque jeu de données déposé ou demandent un paiement pour des volumes plus élevés. Cette information n’est malheureusement pas indiquée dans les répertoires, il vous faut la chercher sur le site web de l’entrepôt.

Print Friendly, PDF & Email