[Mise à jour le 15 novembre 2014 : le code d’AlphaFold3 est désormais accessible sur GitHub sous licence CC BY-NC-SA 4.0. Les poids du modèle sont quant à eux accessibles sur demande. Voir les commentaires sur les sites de Science et Nature]
Le 8 mai 2024, un article publié dans Nature présente la troisième version du logiciel AlphaFold, logiciel développé par Google DeepMind permettant de prédire la structure des protéines et leur interaction avec d’autres types de molécules en utilisant des méthodes d’intelligence artificielle. Contrairement à la précédente version du logiciel, le code complet d’AlphaFold3 n’est pas disponible. Seule une description du fonctionnement du modèle est mise à disposition : un « pseudocode ».
Une lettre adressée à Nature le 14 mai (signée depuis par plus de 1000 chercheurs) demande aux éditeurs de Nature d’expliquer pourquoi ils n’ont pas exigé des auteurs qu’ils publient leur code, comme le prévoit la politique du journal (même les reviewers n’ont pas eu accès au code, malgré des demandes répétées). Les auteurs de la lettre se disent très déçus de l’absence de code source ouvert qui limite les possibilités de vérification, de reproductibilité et de réutilisation. Ils rappellent que l’ouverture du code d’AlphaFold2 avait été essentielle pour la biologie structurale : le code avait pu être étendu et modifié pour de nouvelles méthodes et applications dans la conception de protéines et la prédiction d’assemblages de protéines.
Le 22 mai 2024, Nature répond à cette critique et explique que, pour AlphaFold2, l’équipe DeepMind avait travaillé avec un institut financé sur fonds publics, l’EMBL’s European Bioinformatics Institute alors que pour la version 3, DeepMind s’est associé à Isomorphic Labs, une société privée de développement de médicaments. Dans ce contexte, Nature considère comme un élément positif le fait que les résultats de travaux financés par le secteur privé soient publiés dans une revue à comité de lecture, ce qui n’est pas souvent le cas. L’éditeur rappelle par ailleurs que sa politique prévoit des exceptions au partage du code, notamment pour en protéger la confidentialité.
Suite à la publication de la lettre ouverte à Nature, DeepMind a annoncé sur X que le modèle AlphaFold3 serait mis à disposition des universités dans les six mois. Mais certains chercheurs ont des doutes : ils pensent que cette version aura des limitations fonctionnelles, en particulier concernant la capacité de prédire la structure des protéines en conjonction avec des molécules médicamenteuses potentielles.
Plusieurs chercheurs se sont donc lancés dans le développement de leur propre version open-source d’AlphaFold3. Selon ces chercheurs, la principale difficulté n’est cependant pas de réussir à réécrire le code d’AlphaFold3. L’étape la plus longue et la plus coûteuse sera l’entraînement du modèle, qui pourrait coûter plus d’un million de dollars en ressources informatiques.


