Gestion et partage des données et des logiciels

Big data : l’impact environnemental des données et du numérique

Le mouvement de la science ouverte incite au partage massif des données de la recherche. Le volume de ces données (essentiellement numériques dans le domaine biomédical) ne cesse d’augmenter, notamment avec l’explosion des technologies d’intelligence artificielle. Cependant, toutes ces activités ne sont pas anodines, et, comme le numérique dans sa globalité, ont un impact environnemental non négligeable. Petite sélection de ressources sur le sujet.

Selon Statista, le volume de données numériques créées ou répliquées à l’échelle mondiale a été multiplié par plus de trente au cours de la dernière décennie, passant de 2 zettaoctets en 2010 à 64 zettaoctets en 2020 (un zettaoctet équivaut à un milliard de téraoctets, soit mille milliards de gigaoctets). Et selon les prévisions, le volume de données générées dans le monde devrait dépasser 180 zettaoctets en 2025 et atteindre le seuil astronomique des 2 000 zettaoctets à l’horizon 2035.

Infographie: Le Big Bang du Big Data | Statista

Dans un atelier ayant eu lieu en octobre 2021 à la réunion RDA France, Françoise Berthoud, ingénieure de recherche en informatique au GRICAD, fait le point sur les impacts environnementaux de tels volumes de données. Elle met l’accent notamment sur le fait que 612 zettaoctets (volume de données estimé pour 2030) correspondant à « plus de 15% du total des Gaz à Effet de Serre que l’on pourra émettre en 2030 pour rester sous la barre des 2°C (à technologie numérique égale). »

Pour les amateurs de podcast, nous vous invitons à écouter l’intervention de Françoise Berthoud dans le podcast Techologie, « le podcast qui tente de lier technologie et écologie » : Au-delà des impacts environnementaux directs du numérique.

La mesure de l’impact environnemental du numérique est au cœur de plusieurs projets. Quelques exemples :

  • Le projet CODECARBON a pour objectif de mesurer la consommation énergétique et l’empreinte carbone des algorithmes développés pour l’Intelligence Artificielle. Concrètement, CodeCarbon propose aux développeurs d’intégrer un package Python dans leur code, de manière à estimer la quantité de CO2 produite lors de l’exécution de ce code, et ainsi leur proposer des améliorations pour optimiser leur code ou leur infrastructure de stockage.
  • Le projet NegaOctet vise à développer une méthodologie et un outil d’évaluation pour mesurer et réduire de manière significative l’impact environnemental des services numériques sur l’ensemble de leur cycle de vie. Une partie des données issues de ce projet sera accessible gratuitement via la base de données Impacts de l’ADEME et une base de données plus complète sera accessible de façon payante.

Pour aller plus loin, retrouvez ici une page listant des ressources sur le sujet du numérique éco-responsable : https://github.com/supertanuki/numeriqueEcoResponsable