[Mise à jour d’un article initialement publié en octobre 2020]
Les principes FAIR correspondent à des lignes directrices dont l’objectif est de rendre les ressources numériques Faciles à trouver, Accessibles, Interopérables et Réutilisables. Décrits en 2016 dans l’article The FAIR Guiding Principles for scientific data management and stewardship, ces principes s’appliquent en premier lieu aux données de la recherche mais peuvent également s’appliquer à d’autres ressources numériques, comme les logiciels de recherche (on vous explique comment rendre votre logiciel FAIR ici).
Les principes FAIR ont pour objectif premier de permettre aux machines de trouver et utiliser automatiquement les données. Les principes détaillés ici comportent donc des termes liés à l’informatique, dont la compréhension n’est pas forcément évidente. En les simplifiant, il est toutefois possible de les utiliser comme un guide de bonnes pratiques pour améliorer la réutilisation des données par les humains. C’est ce que nous vous proposons ci-dessous.
Findable / Facile à trouver
Avant de pouvoir réutiliser des données, il faut pouvoir les trouver. Pour que les données soient faciles à trouver, il est recommandé de :
- Déposer les données dans un entrepôt ;
- Attribuer un identifiant unique et pérenne aux jeux de données, comme un DOI par exemple ;
- Décrire les données par des métadonnées riches.
Accessible
Une fois que l’utilisateur a trouvé les données, il doit savoir comment y accéder. Pour que les données soient accessibles, il est recommandé de :
- Définir les conditions d’accès aux données ;
- Si possible, rendre les données accessibles librement ;
- Si les données doivent rester en accès restreint, rendre accessibles les métadonnées pour signaler l’existence des données.
Notez bien ici que, selon ces principes, des données peuvent être FAIR sans être librement accessibles. Suivre les principes FAIR permet de s’assurer que ses données sont réutilisables, qu’elles soient partagées ou non.
Interopérable
Les données doivent pouvoir être lues et modifiées par divers logiciels et applications et être intégrées à d’autres données. Pour que les données soient interopérables, il est recommandé de :
- Privilégier des formats de fichiers ouverts ou largement utilisés ;
- Mettre à disposition le code source du logiciel nécessaire pour lire, traiter, analyser les données s’il a été développé en interne ;
- Privilégier les standards de métadonnées et les vocabulaires standards ;
- Si possible, indiquer des liens vers d’autres ressources (autres jeux de données, publications…).
Reusable / Réutilisable
Les données doivent pouvoir être utilisées, combinées et enrichies dans différents contextes. Pour que les données soient réutilisables, il est recommandé de :
- Associer une licence de diffusion aux jeux de données ;
- Associer de la documentation pour décrire les données de façon détaillée, les contextualiser, les rendre compréhensibles…
En examinant ces bonnes pratiques, on se rend compte que l’application de certaines d’entre elles est largement facilitée par l’utilisation d’un entrepôt de données (attribution d’un identifiant pérenne, exposition de métadonnées sur internet, utilisation de standards de métadonnées et de vocabulaires standards, liens entre ressources…).
En revanche, certaines peuvent être mises en application en dehors de tout dépôt dans un entrepôt et sont essentielles pour permettre la réutilisation des données par votre « futur vous-même », vos collègues ou d’autres scientifiques (en particulier les recommandations concernant les formats de fichiers et la documentation des données).
Pour aller plus loin : consultez la page de DoRANum dédiée aux principes FAIR


