Zenodo est un entrepôt pluridisciplinaire lancé en 2013 pour soutenir la politique d’Open Access et d’Open Data de la Commission européenne. Développé et hébergé par le CERN, Zenodo est un logiciel open source (code open source, basé sur le logiciel Invenio, lui-même open source).
Zenodo est utilisable par toute la communauté scientifique pour la préservation et le partage des résultats de la recherche pour lesquels il n’existe pas de dépôt institutionnel, disciplinaire ou thématique. L’entrepôt est ouvert à une large diversité de produits de recherche :
- Publications scientifiques : Zenodo peut être utilisé comme une archive ouverte pour la conservation et la diffusion des publications (c’est peu le cas en France car l’archive nationale HAL est privilégiée et soutenue par le ministère de la recherche).
- Jeux de données : De par sa facilité d’utilisation, Zenodo est souvent utilisé pour partager des données associées à une publication (on vous explique comme faire ici).
- Logiciels : Zenodo peut notamment être utilisé pour rendre son code facilement citable (on vous explique comment faire ici).
- Autres contenus scientifiques : présentations, posters, images, vidéos, cours…
Zoom sur les avantages et inconvénients de Zenodo pour le partage de données de recherche :
Les avantages :
– Zenodo attribue un identifiant unique et pérenne (DOI) aux jeux de données qui n’en disposent pas, ce qui permet de les citer facilement ;
– Zenodo permet de définir facilement les conditions d’accès aux données (et ces conditions d’accès peuvent être modifiées après publication) :
- Open Access : les données sont accessibles librement (fichiers téléchargeables librement) et associées à une licence de diffusion choisie par la personne qui dépose les données ;
- Restricted Access : les fichiers ne sont pas téléchargeables librement mais accessibles sur demande. La personne qui dépose les données définit librement les conditions selon lesquelles elle fournira l’accès aux données ;
- Closed Access : les fichiers ne sont pas accessibles (même pas sur demande) mais les métadonnées de description du jeu de données restent disponibles sur Zenodo (il peut s’agir par exemple de données “rétractées”) ;
- Embargoed Access : les fichiers ne sont pas accessibles (Closed Access) pendant la durée d’embargo définie par la personne qui dépose les données. A la fin de cet embargo, les données deviennent automatiquement accessibles (Open Access).
– Zenodo permet de rendre les données accessibles sur le long terme : les fichiers sont conservés pendant toute la durée de vie de l’entrepôt (ce qui correspond à la durée de vie du CERN qui dispose actuellement d’un programme expérimental défini pour les 20 prochaines années au moins). Les fichiers sont conservés en plusieurs copies sur plusieurs site et sauvegardés sur bande chaque nuit. Attention, le CERN assure que les fichiers seront toujours disponibles dans 20 ans mais il ne s’engage pas à ce que les fichiers soient toujours lisibles et compréhensibles !
Les inconvénients :
– La taille limite d’un jeu de données est de 50 GB. Des quotas plus élevés peuvent être demandés et accordés au cas par cas.
– Seule la personne qui dépose les données peut modifier son jeu de données. Il n’est pas possible pour le moment de partager un dépôt avec d’autres utilisateurs.
– Zenodo étant un entrepôt pluridisciplinaire, les standards de métadonnées utilisés sont généralistes : l’entrepôt ne propose pas aux utilisateurs de décrire leurs données en suivant des standards disciplinaires (comme le standard ISA-Tab en sciences de la vie). En conséquence, la description des jeux de données est souvent pauvre.
– La qualité des données et des métadonnées n’est pas vérifiée : tous les dépôts sont acceptés, à condition que les (quelques) métadonnées obligatoires soient complétées. Il n’y a aucune vérification manuelle de la qualité et de la richesse des informations fournies (modération).
Rappelons que la principale condition pour que des données soient compréhensibles et réutilisables est qu’elles soient décrites précisément.
Si vous cherchez un entrepôt généraliste qui offre davantage de possibilités pour décrire précisément un jeu de données, retrouvez notre présentation de Recherche Data Gouv ici.