Inclure du code informatique dans sa démarche scientifique est désormais le quotidien d’un grand nombre de chercheurs. Les documents computationnels (ou notebooks) qui permettent d’intégrer dans un même document du texte, du code et des résultats, ont donc gagné en popularité. Zoom sur ces documents qui permettent une recherche plus transparente et plus reproductible.
Les documents computationnels ou notebooks peuvent être utilisés au quotidien par les chercheurs pour documenter leur démarche scientifique, souvent exploratoire. Concrètement, le scientifique peut inclure dans son document :
- du texte, dans un langage de balisage léger de type markdown par exemple : explication sur les données récupérées, les questions que l’on se pose, l’hypothèse formulée, etc.
- du code informatique exécutable, permettant de répondre à la question posée ;
- le résultat de ce code : tableau, graphique, résultat de calculs, visualisation de données…
En enchainant ces étapes logiques, le scientifique peut ainsi raconter une histoire sur la façon dont il a réfléchi, les questions qu’il s’est posées, les résultats intermédiaires qu’il a obtenus… Ces étapes, généralement non présentées dans les articles scientifiques, sont essentielles pour comprendre le cheminement de pensée du chercheur, les choix qu’il a fait, etc.
Ainsi, les documents computationnels permettent de :
- documenter son code au fur et à mesure de sa recherche ;
- faciliter la compréhension du code et de la démarche, par ses collègues, ou par soi-même plusieurs années après…
- publier plus facilement un article exécutable (on vous explique ce que c’est ici).
Et concrètement, comment fait-on ?
Plusieurs outils existent pour écrire des documents computationnels. Les plus utilisés sont Jupyter, Rmarkdown et Org-mode. Les principales différences entre ces trois outils sont présentées par Arnaud Legrand, chercheur au Laboratoire d’Informatique de Grenoble, dans un webinaire disponible en replay.
Pour aller plus loin, vous pouvez consulter :