Lors du montage de votre projet de recherche, vous pouvez (ou devez) inclure, dans le dossier soumis au financeur, un paragraphe décrivant comment vous allez gérer et partager les données de recherche et autres résultats de recherche (principalement les scripts, logiciels ou programmes) générés ou collectés pendant le projet. C’est par exemple le cas pour les appels à projet Horizon Europe (section Data management d’une page à compléter) ou de l’Alzheimer’s Association (Plan for data sharing d’une page). Ce paragraphe est différent du plan de gestion des données, plus développé, et généralement demandé après acceptation du projet.
Comment rédiger ce paragraphe ?
La méthode la plus simple consiste à se poser les questions ci-dessous et à y répondre à le plus précisément possible. Si vous ne disposez pas de toutes les réponses, vous pouvez indiquer que cela sera déterminé au cours du projet (choix de la licence ou de l’entrepôt par exemple).
– Quels sont les différents types de données ou résultats de recherche qui vont être produits, collectés ou réutilisés pendant le projet ? Avez-vous prévu d’utiliser des formats de fichier ouverts ou largement utilisés ? Pouvez-vous estimer le volume de données générées ?
– Pour chaque type de données ou résultat de recherche, avez-vous identifié ceux qui pourront être rendus librement accessibles et ceux qui devront rester confidentiels ou en accès restreint ?
- Pour ceux qui peuvent être rendus librement accessibles : quand le seront-ils (après la publication des manuscrits associés par exemple) et par quel moyen ? (codes sur Github, données partagées sur demande, déposées dans un entrepôt…). Avez-vous prévu d’associer une licence de diffusion aux jeux de données (par exemple une licence Creative Commons) pour faciliter leur réutilisation ?
- Pour ceux qui devront rester confidentiels ou en accès restreint : pour quelle raison ? (données confidentielles jusqu’au dépôt d’une demande de brevet, données à caractère personnel ne pouvant être partagées librement…)
– Pour chaque type de données pouvant être partagé (accès libre ou restreint), avez-vous identifié les entrepôts de données qui pourront être utilisés ? Ces entrepôts permettront de rendre vos jeux de données “trouvables” (Findable) en leur attribuant notamment un identifiant unique.
– Les jeux de données seront-ils associés à des métadonnées et/ou de la documentation de façon à ce que les données soient contextualisées, compréhensibles et réutilisables ? Les logiciels/outils nécessaires à la validation/interprétation/réutilisation des données seront-ils disponibles librement ou a minima cités dans la documentation associée aux données ?
– Qui/Quel partenaire sera en charge de la gestion des données et de la rédaction du plan de gestion des données ? Comment comptez-vous couvrir les coûts de stockage/curation des données ?
Pourquoi rédiger ce paragraphe ?
En répondant le plus précisément possible à ces questions, vous montrerez ainsi au financeur que vous êtes conscient de l’importance de la gestion des données de recherche, que vous avez anticipé ces problématiques et que vous êtes prêt à mettre en place les bonnes pratiques et suivre les principes FAIR. De plus, si le financeur vous demande par la suite un plan de gestion des données, il ne sera que plus facile à préparer.
Qui contacter pour se faire accompagner ?
Les organismes de recherche disposent souvent d’un service pour l’accompagnement à la rédaction des plans de gestion des données et assimilés. Pensez à consulter le répertoire SOS-PGD pour identifier votre interlocuteur au sein de votre institution. Pour les pasteuriens, n’hésitez-pas à contacter pgd@pasteur.fr.