On vous explique

Wikidata

Wikidata est partout et vous ne le savez peut-être pas ! A ce jour, la base de connaissance libre est composée de plus de 110 millions d’éléments de données que tout un chacun peut enrichir. Née en 2012, Wikidata est depuis devenue l’infrastructure de base pour l’utilisation, le partage et la conservation collaborative des connaissances de références structurées.

Wikidata, c’est quoi ?

Wikidata sert initialement de dépôt central de données structurées pour ses projets frères comme la bien connue encyclopédie libre Wikipédia. C’est une base lisible et modifiable tant par des personnes que par des machines informatisées. Elle est multilingue avec plus de 280 versions linguistiques.

La base adhère aux principes FAIR : son contenu structuré, disponible sous licence CC0, est facile à trouver, accessible, interopérable et réutilisable. Il peut facilement être exporté dans des formats standards et relié à d’autres ensembles de données libres sur le web. Ainsi, Wikidata contribue au fonctionnement de milliers de sites internet et services.

Comment ça marche ?

Le référentiel Wikidata est constitué principalement d’éléments, chacun ayant un libellé, une description et un certain nombre d’alias. Les éléments sont identifiés de manière unique par un Q suivi d’un nombre, comme par exemple Yasmine Belkaïd (Q 28843432).

Les déclarations décrivent les caractéristiques détaillées d’un élément et consistent en une propriété et une valeur. Les propriétés dans Wikidata ont un P suivi d’un nombre, comme avec educated at (P69).

Wikidata enregistre non seulement les déclarations, mais aussi leurs sources et les connexions avec d’autres bases de données. Cela reflète la diversité des connaissances disponibles et soutient le principe de vérifiabilité.

Wikidata pour la recherche

Wikidata a été conçue pour soutenir à la fois la communauté qui crée Wikipédia et l’utilisation par des tierces parties qui veulent pouvoir utiliser de grandes quantités de données organisées.

Dans son article, Wikidata : un outil pour vous, les chercheurs, Pascal Martinolli explique parfaitement l’utilité de Wikidata, que ce soit pour votre identité de chercheuse et chercheur, la collecte des données, le partage de vos données…

En 2019 déjà, concernant les identifiants numériques des chercheurs, le Comité pour la science ouverte présentait Wikidata comme la base de données incontournable car devenue le premier outil mondial fédérateur des identifiants pérennes de chercheurs. Il a même émis le souhait que chaque chercheur français ait un élément Wikidata aligné avec tous ses autres identifiants (ORCID, idHAL, Researcher ID, etc.). Wikidata est par exemple l’une des ressources d’OpenAlex.

Pour finir, voici ci-dessous quelques articles de référence autour de Wikidata pour la recherche :

  • Ten quick tips for editing Wikidata (2023) : des recommandations d’usage de Wikidata.
  • Wikidata as a semantic framework for the gene wiki initiative (2016). Les auteurs expliquent qu’ils ont créé une ressource de données entièrement ouverte et extensible pour les données de biologie moléculaire et de biochimie chez l’homme et la souris (Gene Wiki initiative). Cette ressource enrichit toutes les ‘Wikipédias’ avec des informations structurées et sert de nouveau centre de liaison pour le web sémantique biologique.
  • Wikidata and the bibliography of life (2022). Contrairement à d’autres disciplines telles que la biomédecine, la communauté taxonomique ne dispose pas d’une base de données centralisée et conservée (la « bibliographie de la vie »). Cet article soutient que Wikidata peut être cette base de données car elle dispose de modèles flexibles et sophistiqués d’informations bibliographiques et d’une communauté active de personnes et de programmes (« bots ») qui ajoutent, modifient et conservent ces informations.

Note : cet article est librement inspiré de toutes les pages Wikimedia consacrées à Wikidata.