On vous explique

Software Heritage

Software Heritage est une plateforme ayant pour but de collecter, organiser, préserver et rendre accessible le code source de tous les logiciels disponibles publiquement. Ce projet a été initié par l’INRIA (Institut national de recherche en sciences et technologies du numérique) en 2015 et a pour ambition de construire « l’archive universelle des logiciels ».

Une grande partie des connaissances techniques et scientifiques développées aujourd’hui réside dans les logiciels. Cependant, les codes sources des logiciels libres sont souvent éparpillés sur une variété de plateformes, dont certaines sont susceptibles de fermer (cela a été le cas de Google Code et Gitorious par exemple). Il est donc apparu comme essentiel de rassembler et préserver ce corpus de connaissances universelles.

Pour cela, l’équipe de Software Heritage développe une infrastructure autour d’un « moissonneur » qui va chercher directement les codes sources accessibles en ligne. Les utilisateurs peuvent également intégrer directement leurs codes sources au dispositif, notamment via l’interconnexion avec l’archive ouverte HAL.

Software Heritage attribue un identifiant unique et pérenne (SWH-ID) à chaque composant logiciel déposé et à chaque version du logiciel. Les logiciels deviennent donc des produits de recherche légitimes et citables, au même titre que les publications ou les données.

Pour aller plus loin, consultez l’article de CNRS Info, paru le 9 décembre 2020