L’intelligence artificielle dévoile le secret de millions de protéines

- EN- DE- FR - IT
Un instantané du réseau interactif "Protein Universe Atlas". (Image :
Un instantané du réseau interactif "Protein Universe Atlas". (Image : Université de Bâle, Biozentrum)
Une équipe de recherche de l’Université de Bâle a découvert une véritable mine de protéines non décrites jusqu’à présent. Grâce aux derniers développements en matière de "deep learning", les chercheurs ont réussi à découvrir des centaines de nouvelles familles de protéines et même un nouveau type de pliage des protéines. L’étude est maintenant publiée dans "Nature".

Au cours des dernières années, ’AlphaFold’ a révolutionné la recherche sur les protéines. L’intelligence artificielle (IA) a été nourrie de données sur les protéines que les scientifiques ont mis plus de 50 ans à rassembler. Grâce à cet entraînement, ’AlphaFold’ est désormais en mesure de prédire la forme tridimensionnelle des protéines avec une très grande précision. L’année dernière, l’IA a permis de prédire la structure d’environ 215 millions de protéines. Cela permet d’avoir un aperçu de la structure de presque toutes les protéines. Cela est particulièrement intéressant pour les protéines qui n’ont pas encore fait l’objet d’une étude expérimentale approfondie - un processus long et fastidieux.

Il existe désormais de très nombreuses sources d’informations sur les protéines. Elles fournissent des informations précieuses sur la manière dont les protéines se développent et fonctionnent’, explique Joana Pereira, responsable de l’étude. Pourtant, la recherche a longtemps été confrontée à une jungle de données. L’équipe de recherche de Torsten Schwede au biocentre de l’université de Bâle et directeur de recherche au Swiss Institute of Bioinformatics (SIB) a réussi pour la première fois à décrypter une partie de ces informations cachées.

Une perspective à vol d’oiseau révèle de nouvelles familles et de nouveaux repliements de protéines

Les chercheurs ont créé un réseau interactif composé de 53 millions de protéines dont ’AlphaFold’ a modélisé la structure avec une grande qualité. Ce réseau est une source précieuse pour la prédiction théorique à grande échelle de familles de protéines inconnues et de leurs fonctions", souligne le Dr Janani Durairaj, premier auteur de l’étude. L’équipe a ainsi découvert 290 nouvelles familles de protéines et une nouvelle façon de plier les protéines. Elle se rapproche de la forme d’une fleur.

En se basant sur l’expertise du groupe de recherche de Torsten Schwede dans le développement et la maintenance du logiciel SWISS-MODEL pour la modélisation des protéines, ils ont mis à disposition le réseau nouvellement développé sous forme de plateforme interactive sur Internet. Celle-ci est appelée ’Protein Universe Atlas’.

L’IA, un outil précieux pour la recherche

Enfin, les chercheurs ont misé sur des outils d’apprentissage profond pour rechercher dans ce réseau des informations qui ouvrent de nouvelles voies à l’innovation dans les sciences et technologies du vivant. ’Pour trouver de nouvelles substances actives pour des médicaments ou pour modifier la fonction des protéines à l’aide de procédés biotechnologiques, nous devons d’abord connaître la structure des protéines et comprendre comment elles fonctionnent’, explique Pereira.

Le Swiss Institute of Bioinformatics a soutenu le projet de recherche avec une subvention ’Kickstarter’, lancée pour faire progresser l’utilisation de l’IA dans les sciences de la vie. Elle souligne le potentiel de transformation du deep learning et des algorithmes intelligents dans la recherche.

Grâce au ’Protein Universe Atlas’, les scientifiques du monde entier peuvent désormais en savoir plus sur les protéines pertinentes pour leurs recherches. ’Nous espérons que cette nouvelle plateforme aidera non seulement les chercheurs et les biocurateurs, mais aussi les étudiants et les enseignants à en apprendre davantage sur la diversité des protéines, de leur structure à leur fonction et à leur évolution’, ajoute Janani Durairaj.

Publication originale

Janani Durairaj, Andrew M. Waterhouse, Toomas Mets, Tetiana Brodiazhenko, Minhal Abdullah, Gabriel Studer, Gerardo Tauriello, Mehmet Akdel, Antonina Andreeva, Alex Bateman6, Tanel Tenson, Vasili Hauryliuk, Torsten Schwede, Joana Pereira Uncovering new families and folds in the natural protein universe.
Nature (2023), doi : 10.1038/s41586’023 -06622-3



Annonce