Gestion et partage des données et des logiciels

Partage des codes et des données de la recherche : qu’est-ce qui bloque ?

Dans un long article paru fin novembre, un groupe de travail réuni lors de la réunion inaugurale de la Society for Open, Reproducible, and Transparent Ecology and Evolution identifie les principales barrières, réelles ou supposées, qui retiennent les chercheurs de partager leurs codes et leurs données de recherche.

Les bénéfices de ce partage, rappelés en introduction par les auteurs, sont nombreux :

  • Le partage des données rend possible leur ré-analyse avec des méthodes nouvelles ou améliorées, ou par des chercheurs ayant des questions totalement différentes de celles pour lesquelles les données avaient été collectées initialement. Cela permet également leur agrégation avec d’autres jeux de données et a un effet bénéfique prouvé en terme de visibilité, de taux de citations et de facilité à trouver des collaborations.
  • Quant au partage du code, il permet aux chercheurs de ne pas avoir à « réinventer la roue » dans leurs nouveaux projets, de modifier le code existant pour leurs propres besoins et facilite grandement la reproductibilité des méthodes.

Néanmoins, les auteurs ont recensé un grand nombre de barrières à ce partage qu’ils ont divisé en trois grandes catégories :

  • Le manque de connaissances (Knowledge barriers) : certains chercheurs ne savent pas comment partager, trouvent le processus trop complexe, pensent que leurs données sont trop volumineuses pour être partagées, ressentent un sentiment d’ « insécurité » au fait d’exposer publiquement leur travail, ou ne voient pas l’intérêt de partager leurs données ou codes.
  • Les inquiétudes vis-à-vis de la réutilisation de ses résultats (Reuse concerns) : certains chercheurs ont peur que d’autres utilisent leurs données et leur code de manière inappropriée, hésitent à renoncer à leur droit exclusif de les utiliser, considèrent que leurs données sont trop sensibles pour être partagées, ou que les infrastructures disponibles ne permettront pas la réutilisation sur le long terme de leurs résultats.
  • Les freins à la carrière (disincentives) : certains chercheurs ont peur que d’autres réutilisent leurs données/codes et publient avant eux (peur de se faire « scooper »), considèrent que ces tâches prennent trop de temps, ou qu’il y a un manque d’incitations au partage (manque de reconnaissance, de bénéfices). 

Pour chaque raison ou barrière, les auteurs essaient d’apporter une solution et de déconstruire la crainte, tout en admettant la réalité d’un certain nombre de ces barrières et les progrès qu’il reste à réaliser dans ce domaine.

Retrouvez ci-dessous un résumé des barrières et des solutions proposées :

Figure 1 de l'article : Perceived barriers and solutions to sharing data and code.
Dylan G. E. Gomes, Patrice Pottier, Robert Crystal-Ornelas, Emma J. Hudgins, Vivienne Foroughirad, Luna L. Sánchez-Reyes, Rachel Turba, Paula Andrea Martinez, David Moreau, Michael G. Bertram, Cooper A. Smout and Kaitlyn M. Gaynor. Why don’t we share data and code? Perceived barriers and benefits to public archiving practices (Figure 1). https://doi.org/10.1098/rspb.2022.1113. Licence CC-BY 4.0

 

Un travail complet et sérieux sur la question, qui éclaire les différents freins que rencontre la recherche en biologie aujourd’hui.

Print Friendly, PDF & Email