Une équipe du Scholarly Communications Lab a construit un dataset recensant les frais de publication en Open Access (APC, Article Processing Charges) demandés par les revues de 6 grands éditeurs, sur la période 2019-2023 : Elsevier, Frontiers, PLOS, MDPI, Springer Nature et Wiley.
Le préprint décrivant le dataset (un bel exemple de data paper) a été déposé sur arXiv le 12 juin dernier et le dataset lui-même est disponible sur Harvard Dataverse sous licence CC0.
Les auteurs de ce préprint se sont appuyés sur les listes de prix fournies par les éditeurs, qu’ils ont régulièrement téléchargées depuis leur site web. Les fichiers téléchargés (dans des formats très variables) ont été combinés pour construire un unique dataset, cohérent et homogène, dans un format structuré.
Le dataset comprend les APC de 8 712 revues uniques :
- Elsevier (n=3 094), Springer Nature (n=2 952) et Wiley (n=2 018) sont en tête avec un très grand nombre de revues payantes, soit selon le modèle gold Open Access (voie dorée), soit selon le modèle hybride (revues sur abonnement dans lesquelles certains articles sont en Open Access via le paiement d’APC).
- Frontiers (n=221), MDPI (n=431) et PLOS (n=12) publient beaucoup moins de revues, mais tous leurs titres sont en gold Open Access.
L’analyse des données montre globalement que :
- Les APC s’étalent entre 150 $ pour les Elsevier’s Materials Today : Proceedings entre 2019 et 2021 et 11 690 $ pour 37 revues de Nature en 2023.
- 89 % des revues ont augmenté leurs tarifs entre 2019 et 2023.
- Pour les 3 éditeurs ayant à la fois des revues en gold et en hybrid Open Access : le montant des APC est plus élevé pour les revues hybrides : le coût moyen par article (pour les 5 années étudiées) était de 1 977 $ pour les revues gold et de 3 137 $ pour les revues hybrides.
A noter que pour 123 revues, le montant des APC indiqué était de 0 $. Il peut s’agir d’une exonération temporaire de paiement à des fins de marketing ou de revues diamant dont les coûts de publication sont couverts par un tiers. Ces revues ont été exclues de l’analyse.
Les auteurs reconnaissent des limites à ce dataset, liées à la méthode de recueil basée sur les informations fournies par les éditeurs : potentielles inexactitudes, informations manquantes pour certaines revues… Ils prévoient de mettre à jour ce dataset en complétant les APC manquants et en vérifiant le modèle des revues par une curation manuelle. Malgré ces limites, les auteurs considèrent que ce dataset peut être utile, notamment pour estimer les dépenses liées aux APC.


