On vous explique

Recherche Data Gouv

Recherche Data Gouv est un « écosystème au service du partage et de l’ouverture des données de recherche » inauguré le 8 juillet 2022 par la ministre de l’Enseignement supérieur et de la Recherche. Cet écosystème comprend :

  • Des équipes dédiées à l’accompagnement des scientifiques sur les questions relatives aux données : ateliers de la donnée, centres de référence thématiques et centres de ressources ;
  • Des outils pour déposer, publier et signaler des données : un entrepôt pour déposer et utiliser des données, et un catalogue (pas encore opérationnel) pour rechercher les données publiées sur l’entrepôt ou sur des entrepôts externes.

Zoom sur le module « Entrepôt » de Recherche Data Gouv

Il s’agit d’un entrepôt de données

  • national et donc souverain, construit avec la participation de plusieurs organismes de recherche et universités ;
  • ouvert à toute personne de l’enseignement supérieur et de la recherche et dédié au partage de données scientifiques ;
  • pluridisciplinaire, à utiliser dans le cas où aucun entrepôt institutionnel ou disciplinaire n’existe ou ne convient ;
  • basé sur le logiciel libre Dataverse ;
  • qui facilite la mise en œuvre des principes FAIR (attribution de DOI aux jeux de données, utilisation de standards de métadonnées, possibilité de choisir une licence de diffusion… ) ;
  • qui permet de définir le niveau d’accès aux données : données accessibles librement ou en accès restreint (à noter que les restrictions d’accès peuvent se faire au niveau du fichier ou au niveau du jeu de données).

Le fonctionnement de l’entrepôt Recherche Data Gouv (RDG) se rapproche de celui de Zenodo, entrepôt pluridisciplinaire financé par la Commission Européenne et hébergé au CERN, mais il a ses propres spécificités. En particulier :

  • RDG est dédié aux données de la recherche alors que Zenodo est ouvert à une plus large diversité de produits de recherche (articles, images, jeux de données, logiciels, présentations…) ;
  • RDG offre la possibilité de décrire précisément son jeu de données, en proposant des standards de métadonnées disciplinaires (standard ISA-Tab en sciences de la vie) pour compléter les métadonnées généralistes ;
  • RDG est un entrepôt avec curation manuelle : des curateurs vérifient les métadonnées des jeux de données avant ou après leur mise en ligne ;
  • RDG n’impose pas de limite de volume pour les jeux de données contrairement à Zenodo pour lequel le volume maximal d’un jeu de données est de 50 GB (la seule limite de RDG est que chaque fichier unitaire ne peut pas dépasser 50 GB).

Si vous souhaitez apprendre à utiliser l’entrepôt Recherche Data Gouv, n’hésitez pas à suivre les classes virtuelles et à faire des tests dans le bac à sable.

Print Friendly, PDF & Email