Comment une machine reconnaît-elle le plancton? De la même façon que les humains reconnaissent le visage d’autres humains. Deux processus entrent ici en jeu. Tout d’abord, certaines régions du cerveau humain sont spécialisées dans la reconnaissance des visages. C’est pourquoi les bébés réagissent déjà aux visages ou à des représentations qui ressemblent à un visage. La capacité à reconnaître les visages est toutefois encore très vague à la naissance. Les enfants apprennent progressivement à reconnaître et à différencier les personnes en observant de nombreux visages différents.
La classification automatique du plancton fonctionne de manière similaire. Les chercheuses et chercheurs développent d’abord une architecture pour l’apprentissage automatique, spécialisée dans la classification de photos. Cette architecture est encore très vague et flexible. Lors d’une deuxième étape, la machine apprend seule à l’aide d’exemples d’entraînement, soit des milliers de photos de plancton identifiées par des experts, à reconnaître les principales caractéristiques et les principaux modèles pour en déduire l’espèce du plancton. La machine apprend avec chaque nouvelle photo de plancton identifiée, adapte de manière autonome son architecture et affine ainsi sa capacité à classifier le plancton.
Les machines et les humains apprennent de manière similaire
Comme pour les humains, qui en règle générale sont incapables de dire à quoi ils ont reconnu la personne en face, on ignore également les caractéristiques qu’utilise la machine pour identifier le plancton dans le cadre de l’apprentissage automatique. Mais cela n’a pas grande importance lorsqu’il s’agit de classifier des millions de photos de plancton. «Notre objectif est d’être en mesure d’identifier correctement un maximum d’espèces de plancton en très peu de temps», explique le physicien Marco Baity-Jesi, responsable du groupe Eawag Science des données. «L’apprentissage automatique offre de gros avantages dans ce domaine.» Alors qu’un ou une spécialiste peut identifier au maximum quelques dizaines de clichés par jour et en a assez à la fin de la journée, la machine identifie avec précision environ un million de photos de plancton, et ce sans aucun signe de lassitude.
Le groupe de scientifiques qui travaille avec Sreenath Kyathanahally, postdoctorant dans le groupe Science des données, et Marco Baity-Jesi a développé des modèles d’apprentissage automatique, plus précisément de deep learning (ou apprentissage profond), et les a appliqués à la classification du zooplancton dans les lacs suisses. Les meilleurs modèles se basent sur les méthodes de transfer learning et d’ensembling (ou apprentissages par transfert et ensembliste). «Nous avons pu montrer que ces modèles opèrent une meilleure classification des photos de plancton que les modèles utilisés jusqu’à présent», déclare Marco Baity-Jesi. «Nous avons atteint une précision de 98 pour cent.» Les photos de plancton proviennent de l’Aquascope, un microscope sous-marin du groupe Eawag Dynamiques du phytoplancton, dirigé par Francesco Pomati, qui prend quotidiennement des milliers de photos de plancton dans le lac de Greifen.
Deep learning - développer le «cerveau» de la machine
Mais que sont exactement le deep learning, le transfer learning et l’ensembling? Revenons à l’analogie de la reconnaissance faciale. Pour le deep learning, les scientifiques tentent de reproduire au moins approximativement ce que l’évolution a mis des millions d’années à créer, à savoir le cerveau humain avec toutes ses finesses et ses fonctions hautement spécialisées. S’inspirant du cerveau humain, ils approfondissent les structures internes du «cerveau de la machine» et construisent des réseaux neuronaux artificiels dans les algorithmes avec de nombreuses couches intermédiaires. De cette façon, la machine apprend à mettre en lien ce qu’elle a déjà appris avec des nouveaux contenus et approfondit ainsi constamment ses connaissances, et ce sans l’intervention humaine. Avec chaque nouvelle photo de plancton, la machine apprend à reconnaître seule des différences infimes entre ces petits êtres vivants et à les classifier correctement.
L’ensembling est un autre processus en évolution. Cela ressemble à la condamnation d’un criminel: un témoin oculaire c’est bien, plusieurs témoins c’est mieux. Pour l’ensembling, les scientifiques combinent plusieurs méthodes de deep-learning - les témoins oculaires de la machine - afin d’augmenter la précision. Pour qu’un minimum de plancton s’échappe sans avoir été détecté.
Transfer Learning - transférer les connaissances acquises à de nouvelles tâches
Le processus d’apprentissage automatique continue d’être affiné parallèlement au développement du «cerveau de la machine». Le transfer learning consiste à utiliser les connaissances déjà acquises dans d’autres applications. Si la machine sait déjà classifier des visages par exemple, elle peut utiliser cette connaissance pour apprendre à classifier plus rapidement le plancton des lacs. Ce type d’apprentissage présente lui aussi une analogie humaine. Lorsque l’on grandit en Europe, on apprend d’abord à différencier les visages européens. Pour les Européens, les Asiatiques se ressemblent tous. Mais lorsque l’on a intégré les différents traits de visage caractéristiques des Européens, on apprend plus vite à différencier les visages asiatiques, par exemple lors d’un séjour prolongé en Asie.
Les machines apprennent aussi à prédire les crues et la toxicité des substances
Les méthodes d’intelligence artificielle comme l’apprentissage automatique peuvent apporter un soutien à la recherche sur l’eau dans de nombreux domaines. «Nous soutenons aussi d’autres projets de l’Eawag», explique Marco Baity-Jesi. Citons par exemple un projet qui étudie les modèles de prédiction des crues dirigé par Peter Reichert, chef du groupe Analyse des systèmes et gestion de l’eau, et Chaopeng Shen, un professeur américain invité qui travaille actuellement à l’Eawag. «Dans un autre projet, nous travaillons avec le groupe Cellules animales et organismes de Kristin Schirmer pour prédire l’impact des substances chimiques sur les poissons.» Ce dernier devrait permettre de réduire le nombre de tests réalisés sur les animaux vivants pour déterminer la toxicité des substances chimiques.
Photo de couverture: Eawag