Gestion et partage des données et des logiciels

Un nouveau MOOC sur la recherche reproductible pour améliorer vos pratiques de gestion de données massives et de calculs

Pour travailler de manière reproductible, il est nécessaire de connaître des méthodes efficaces ainsi que des outils, d’autant plus lorsque l’on travaille avec de gros volumes de données et des calculs complexes.

Avec le nouveau MOOC « Reproducible Research II: Practices and tools for managing computations and data » vous devriez avoir toutes les cartes en main pour assurer une meilleure reproductibilité computationnelle de vos résultats.

Ce MOOC, ouvert et gratuit, sera disponible sur la plateforme FUN du 16 mai au 4 septembre 2024, en anglais uniquement. Il vient en complément du MOOC « Recherche reproductible : principes méthodologiques pour une science transparente » lancé en 2020 et toujours disponible.

Dans ce deuxième MOOC, vous apprendrez à :

  • Gérer, versionner et archiver vos données massives (formats JSON, FITS et HDF5, outil git-annex, plateformes Zenodo et Software Heritage…).
  • Utiliser des outils et des techniques pour contrôler l’environnement logiciel (outils Guix, Docker, Singularity…).
  • Automatiser les calculs longs ou complexes à l’aide de workflows (outils make et snakemake).

Le MOOC intègre de nombreuses sessions de travaux pratiques. Vous utiliserez notamment ces outils open-source dans un cas concret : une étude de détection des taches solaires.

Quelques prérequis à connaître : avoir une certaine expérience de l’exécution de commandes dans un terminal, ainsi qu’une connaissance de base de git et de Python.

Pour en savoir plus et vous inscrire dès maintenant : plateforme FUN

Print Friendly, PDF & Email