Les chercheuses et chercheurs produisent et partagent des données tout au long du processus de recherche. Pourtant, les jeux de données sont actuellement peu pris en compte dans le cadre de l’évaluation de la recherche, qui se concentre souvent sur les publications.
C’est de ce constat qu’est née l’initiative Make Data Count, présentée par Iratxe Puebla dans un billet publié cet été sur le blog de la DORA (Déclaration de San Francisco sur l’évaluation de la recherche). Comme l’explique Iratxe Puebla, qui dirige cette initiative communautaire, la reconnaissance des jeux de données est une étape importante pour mettre en évidence la diversité des résultats issus des activités de recherche, mais aussi pour permettre de reconnaître des contributions essentielles telles que la curation et l’enrichissement des données.
L’initiative Make Data Count s’inscrit dans la philosophie de la DORA : elle prône des métriques responsables qui devraient inclure une série d’indicateurs (qualitatifs et quantitatifs) contextualisés, afin de pouvoir être interprétés dans des contextes d’évaluation spécifiques. Par ailleurs, ces métriques doivent être vérifiables, c’est-à-dire basées sur des données ouvertes.
Concrètement, l’initiative vise à développer des outils permettant aux entrepôts, plateformes de données et revues de collecter, standardiser et partager des informations sur l’utilisation des jeux de données. Iratxe Puebla présente ainsi plusieurs actions de l’initiative Make Data Count :
– Le développement du standard COUNTER Code of Practice for Research Data, qui vise à standardiser et agréger le nombre de vues et de téléchargements des jeux de données. Cette standardisation permet d’interpréter et de comparer de manière fiable les métriques d’utilisation entre différentes plateformes et entrepôts. Plusieurs entrepôts, dont ceux de l’initiative GREI (Generalist Repository Ecosystem Initiative), ont déjà adopté ce standard.
– La mise en place de workflows pour collecter et agréger les citations de jeux de données. Le projet Data Citation Corpus a ainsi permis de constituer un ensemble centralisé et ouvert de citations de jeux de données, permettant de mieux comprendre l’utilisation et l’impact des données ouvertes. Il contient actuellement près de 10 millions de citations, issues d’articles de revues et de préprints.
– L’accompagnement des institutions dans leur démarche de transformation. En partenariat avec HELIOS Open, l’initiative anime le groupe de travail « Implementing data evaluation in academia », qui développe des ressources pour faire progresser la mise en œuvre de l’évaluation des données dans le cadre des processus institutionnels, dont notamment un guide à destination des institutions.


