I modelli di intelligenza artificiale per lo sviluppo di farmaci falliscono in fisica

- EN- DE- FR- IT

I più moderni programmi di intelligenza artificiale possono supportare lo sviluppo di farmaci prevedendo l’interazione delle proteine con piccole molecole. Tuttavia, i ricercatori dell’Università di Basilea hanno dimostrato che questi programmi imparano solo modelli a memoria, invece di comprendere le relazioni fisiche. Spesso falliscono con nuove proteine che sarebbero particolarmente interessanti per farmaci innovativi.

Le proteine non solo svolgono un ruolo centrale nell’organismo, ma anche in medicina: servono come sostanze attive, come enzimi o anticorpi, oppure sono strutture bersaglio per i farmaci. Il primo passo verso nuove terapie è quindi solitamente quello di decifrare la struttura tridimensionale delle proteine.

Per molto tempo, l’elucidazione delle strutture proteiche ha richiesto molto tempo, fino a quando l’apprendimento automatico ha trovato la sua strada nella ricerca sulle proteine. Modelli di intelligenza artificiale con nomi come AlphaFold o RosettaFold hanno inaugurato una nuova era: calcolano come la catena di elementi costitutivi delle proteine, noti come aminoacidi, si ripiega in una struttura tridimensionale. nel 2024, gli sviluppatori di questi programmi sono stati insigniti del Premio Nobel per la Chimica.

Tasso di successo sospettosamente alto

Le ultime versioni di questi programmi fanno un ulteriore passo avanti: calcolano come la proteina in questione interagisce con un’altra molecola - un partner di docking o "ligando", come lo chiamano gli esperti. Potrebbe trattarsi, ad esempio, di una molecola di farmaco.

questa capacità di prevedere la struttura delle proteine insieme a un ligando è preziosa per lo sviluppo di farmaci", afferma Markus Lill dell’Università di Basilea. Insieme al suo team del Dipartimento di Scienze Farmaceutiche, sta ricercando metodi per la progettazione di sostanze attive.

Tuttavia, le presunte alte percentuali di successo nella predizione della struttura hanno reso Lill e il suo team sospettosi. Soprattutto perché esistono solo circa 100.000 strutture già elucidate di proteine insieme ai loro ligandi per l’addestramento dei modelli di IA, un numero relativamente basso rispetto ad altri set di dati per l’IA. volevamo scoprire se questi modelli di IA imparano davvero i principi fisico-chimici dai dati di addestramento e li applicano correttamente", dice Lill.

Stessa previsione con sito di legame distrutto

I ricercatori hanno modificato la sequenza aminoacidica di centinaia di proteine campione in modo che il sito di legame per il loro ligando avesse una distribuzione di carica completamente diversa o addirittura fosse completamente bloccato. Ciononostante, i modelli di intelligenza artificiale hanno previsto la stessa struttura, come se il legame fosse ancora possibile. I ricercatori hanno proceduto in modo simile con i ligandi: Li hanno modificati in modo che non potessero più agganciarsi alla proteina in questione. I modelli di intelligenza artificiale non si sono preoccupati nemmeno di questo.

In più della metà dei casi, i modelli hanno previsto la struttura come se gli interventi di disturbo nella sequenza aminoacidica non si fossero mai verificati. questo ci dimostra che anche i più moderni modelli di intelligenza artificiale non capiscono davvero perché un farmaco si leghi a una proteina; riconoscono solo modelli già visti", riassume Lill.

Proteine sconosciute particolarmente difficili

I modelli di intelligenza artificiale hanno incontrato particolari difficoltà se le proteine non erano simili ai set di dati di addestramento. se vedono qualcosa di completamente nuovo, si sbagliano rapidamente; ma è proprio qui che si trova la chiave per nuovi farmaci", sottolinea Markus Lill.

Per lo sviluppo di farmaci, i modelli di intelligenza artificiale devono quindi essere considerati con cautela. È importante convalidare le previsioni dei modelli con l’aiuto di esperimenti o analisi computerizzate che tengano effettivamente conto delle proprietà fisico-chimiche. Questo è anche il modo in cui i ricercatori hanno testato i risultati dei modelli AI nel corso del loro studio.

la soluzione migliore sarebbe quella di integrare le leggi fisico-chimiche nei futuri modelli di IA", afferma Lill. Con le loro previsioni strutturali più realistiche, questi potrebbero fornire una base migliore per lo sviluppo di nuovi farmaci, soprattutto per le strutture proteiche che in precedenza erano difficili da delucidare e aprirebbero la possibilità di approcci terapeutici completamente nuovi.

Pubblicazione originale

Matthew R. Masters, Amr H. Mahmoud & Markus A. Lill
Indagare se i modelli di apprendimento profondo per il co-folding apprendono la fisica delle interazioni proteina-ligando
Nature Communications (2025), doi: 10.1038/s41467-025-63947-5