Prédire la toxicité des produits chimiques avec l’IA

Des chercheuses et chercheurs de l’Eawag et du Swiss Data Science Center ont entraîné les algorithmes d’une IA avec un jeu de données écotoxicologiques complet. Leurs modèles d’apprentissage automatique peuvent désormais prédire la toxicité des produits chimiques sur les poissons.

Les produits chimiques sont omniprésents dans notre quotidien, notamment dans la production de denrées alimentaires, de médicaments et de biens de première nécessité. Divers mécanismes de contrôle surveillent de près leur influence sur la santé humaine et l’environnement. Dans son règlement REACH par exemple, l’UE impose que des tests soient effectués pour évaluer la toxicité pour les poissons de tous les produits chimiques dont les volumes de production atteignent au moins 10 tonnes par an. Ces analyses sont chères et nécessitent environ 50’000 poissons par an en Europe.

La science travaille depuis plusieurs décennies à des méthodes alternatives moins coûteuses et pouvant surtout se passer d’expérimentation animale. Ces approches fondées sur l’informatique et capables de prédire les effets des produits chimiques sur les poissons suscitent de grands espoirs.

Des modèles au pouvoir prédictif prometteur

L’institut de recherche sur l’eau Eawag et le Swiss Data Science Center (SDSC) ont réalisé ensemble la curation d’un jeu de données écotoxicologiques complet, afin de le mettre à disposition de la communauté scientifique en tant que benchmark et base de développement pour de nouveaux algorithmes d’IA en écotoxicologie. Baptisé «ADORE», ce jeu se compose d’environ 26’000 points de données qui décrivent les effets de près de 2’000 produits chimiques sur 140 espèces de poissons. Il contient en outre un grand nombre de caractéristiques à la fois des produits chimiques et des espèces.

Comme l’expliquent les chercheuses et chercheurs dans un article qui vient de paraître, les modèles d’apprentissage automatique réussissent bien à prédire la toxicité de ces substances. «Les écarts constatés se situent dans la fourchette normale des fluctuations biologiques», déclarent les deux auteurs principaux de la publication, Lilian Gasser, experte en sciences des données au SDSC, et Christoph Schür, postdoctorant à l’Eawag. Les chercheuses et chercheurs estiment donc que les méthodes étudiées sont «prometteuses pour prédire la mortalité aiguë des poissons». En outre, ces méthodes pourraient être appliquées à d’autres groupes d’espèces sur la base de données appropriées.

«Néanmoins, il existe encore quelques restrictions dont il faut tenir compte», constate l’équipe dans un esprit autocritique. En effet, bien qu’ils fournissent en moyenne des prévisions exploitables, les algorithmes se trompent parfois clairement sur certains poissons. Ils estiment par exemple la toxicité d’un produit chimique est trop élevée pour des espèces données et trop faible pour d’autres. «Apparemment, les modèles sont principalement influencés par quelques propriétés chimiques et ne tiennent pas suffisamment compte des sensibilités spécifiques des espèces», déclare L. Gasser.

Des résultats pertinents grâce à une procédure de test appropriée

Lors de leurs travaux, L. Gasser et C. Schür ont tenu compte du fait que la manière de répartir les données dans un jeu d’entraînement et de test exerce une influence décisive sur l’applicabilité des modèles d’apprentissage automatique. « Il est indispensable de tester l’algorithme uniquement sur des produits chimiques qui ne sont pas présents dans le jeu de données d’entraînement, afin de prouver qu’il est capable d’identifier des caractéristiques chimiques et de prédire effectivement la toxicité », commentent L. Gasser et C. Schür.

L’avenir de la sûreté des produits chimiques

Selon L. Gasser et C. Schür et leurs co-auteurs, il est peu probable que les modèles d’apprentissage automatique et l’intelligence artificielle rendent bientôt superflus les tests de toxicité sur les poissons, mais ils contribuent à leur réduction à long terme. Les scientifiques souhaitent une évaluation plus ciblée de la sûreté des produits chimiques pour qu’elle tienne compte à l’avenir non seulement des propriétés physico-chimiques des substances et des données relatives à la mortalité, mais aussi d’autres facteurs biologiques.

Les prédictions des modèles pourraient ainsi être combinées à des évaluations d’une série d’autres tests, réalisés sans expérimentation animale, qui sont actuellement développés et validés à l’Eawag sur diverses lignées cellulaires de poissons. Pour développer un tel système de sûreté des produits chimiques à forte pertinence, les chercheuses et chercheurs encouragent une étroite collaboration avec les autorités de régulation afin de faire avancer en commun la transposition de la recherche dans la pratique.

Gasser, L.; Schür, C.; Perez-Cruz, F.; Schirmer, K.; Baity-Jesi, M. (2024) Machine learning-based prediction of fish acute mortality: implementation, interpretation, and regulatory relevance, Environmental Science: Advances , doi: 10.1039/d4va00072b , Institutional Repository

Schür, C.; Gasser, L.; Perez-Cruz, F.; Schirmer, K.; Baity-Jesi, M. (2023) A benchmark dataset for machine learning in ecotoxicology, Scientific Data, 10(1), 718 (20 pp.), doi: 10.1038/s41597’023 -02612-2 , Institutional Repository
Ori Schipper