Scegliere il miglior trattamento medico possibile grazie all’IA

- EN- DE- FR- IT
Charlotte Bunne © Emphase / EPFL
Charlotte Bunne © Emphase / EPFL
Per far progredire la medicina, gli scienziati dell’EPFL stanno sviluppando strumenti diagnostici basati sull’intelligenza artificiale. Il loro obiettivo: prevedere il miglior trattamento che i pazienti possono ricevere.

All’EPFL, Charlotte Bunne, direttrice del gruppo Artificial Intelligence in Molecular Medicine, sta sviluppando algoritmi in grado di comprendere i dati straordinariamente complessi di centinaia di strati di tessuto o di proteine marker in una singola cellula. La rivista Dimensions dell’EPFL ha parlato con la ricercatrice del suo lavoro all’avanguardia dell’IA in medicina e biologia.

Quali sono gli obiettivi della sua ricerca?

Stiamo sviluppando uno strumento diagnostico clinico basato sulle tecnologie AI. L’obiettivo è prevedere il miglior trattamento che un paziente può ricevere, cercare di capire in quale fase della malattia si trova e identificare biomarcatori o potenziali bersagli farmacologici da considerare in modo più approfondito. È importante notare che il profilo molecolare e, di conseguenza, il fenotipo di malattia associato a un paziente è unico per ogni individuo. Per adattare le terapie ai profili molecolari individuali sono necessarie non solo misure in grado di comprendere i fattori cellulari e molecolari che influenzano la risposta al trattamento, ma anche potenti tecnologie di intelligenza artificiale in grado di prevedere in modo affidabile questi stessi fattori a partire da grandi insiemi di dati ad alta dimensionalità derivati da una varietà di esperimenti.

E mentre assistiamo alle incredibili prestazioni dell’intelligenza artificiale nei campi della visione e del linguaggio, i dati biologici sono molto diversi: le misurazioni sono indirette, oscure e multimodali. Rappresentano solo istantanee di un sistema intrinsecamente dinamico che governa i processi biologici sottostanti. Non possiamo semplicemente applicare le tecnologie di intelligenza artificiale del linguaggio al campo della biologia. Dobbiamo adattare le architetture e gli algoritmi di apprendimento alle sottigliezze dei modelli e dei dati biologici.

Sebbene le grandi reti neurali siano spesso delle scatole nere in termini di previsioni, dobbiamo progettarle in modo tale da poter almeno capire quali fattori biologici hanno contribuito a una determinata previsione. Questa comprensione è fondamentale per la scoperta di biomarcatori e bersagli farmacologici: getta luce sui meccanismi e sui processi biologici legati alle malattie, rivelando così nuove opportunità terapeutiche.

Come ha iniziato a lavorare in questo campo particolarmente pionieristico?

Ho iniziato presto! All’età di 14 anni ho partecipato a un programma di borse di studio per studenti delle scuole superiori presso il Centro tedesco di ricerca sul cancro e sono rimasto affascinato dal lavoro sulla biologia sintetica, un approccio che combina ingegneria, informatica e biotecnologia. Da allora sono convinto che solo approcci veramente interdisciplinari ci permetteranno di raggiungere i nostri obiettivi. Oggi la mia cattedra è affiliata congiuntamente alla Facoltà di Informatica e Comunicazione e alla Facoltà di Scienze della Vita.

Da studenti delle superiori, abbiamo modificato semplici cellule batteriche per ottenere una nuova funzione: questo ci ha permesso di utilizzarle come piccole macchine in un determinato prodotto. Ora voglio capire come possiamo modificare le cellule umane in modo che acquisiscano proprietà diagnostiche, prevedere il loro comportamento di fronte alle terapie o riprogrammarle da uno stato di malattia a uno stato di salute. Quindi, anche se gli obiettivi, gli strumenti e, soprattutto, il livello di complessità sono molto lontani dal lavoro che svolgevo quando avevo 14 anni, gli elementi essenziali rimangono gli stessi.

Quest’area di ricerca rappresenta chiaramente un acceleratore per lo sviluppo della medicina personalizzata. Ma è davvero decollata negli ultimi anni con i progressi dell’IA?

Sono un giovane ricercatore e mi sono unito a una rivoluzione che era già in corso. Di recente, il campo si è trasformato a una velocità incredibile, perché ora possiamo generare dati biologici high-throughput con una risoluzione senza precedenti. L’organizzazione di enormi serie di dati biomedici è la base per l’addestramento di grandi reti neurali. Per esempio, gran parte del successo dell’ultimo Premio Nobel per la Chimica, assegnato in parte agli scienziati che hanno sviluppato lo strumento di predizione delle strutture proteiche AlphaFold, è dovuto alla Protein Data Bank, una grande raccolta di strutture proteiche accessibile a tutti.

La nostra ricerca si estende su scala più ampia, dove cerchiamo di simulare le funzioni biologiche e il comportamento di cellule e tessuti. I nostri modelli di intelligenza artificiale si basano su dati che misurano centinaia di caratteristiche delle singole cellule e ci informano sulla posizione subcellulare, sulla presenza o sull’abbondanza di proteine e molecole specifiche in una cellula. Stiamo gradualmente integrando questi dati particolarmente ricchi in banche dati. I progressi si basano quindi sulla combinazione di due fattori: la disponibilità di ulteriori campioni e la possibilità di ottenere dati molto dettagliati e ad alta risoluzione sulle cellule umane.

Tuttavia, spesso lavoriamo ancora con regimi di dati deboli. Mancano set di dati che consentano, ad esempio, di catturare i processi cellulari dinamici nel tempo e su più scale fisiche. In particolare, non abbiamo molte coppie di dati che colleghino i cambiamenti molecolari al comportamento su scala tissutale. Ciò significa che dobbiamo essere creativi nello sviluppo dei nostri sistemi di intelligenza artificiale per superare queste limitazioni.

Comprendere appieno la complessità dei sistemi biologici è un compito monumentale. Questi sistemi coinvolgono innumerevoli interazioni molecolari che organizzano la dinamica generale alla scala del sistema stesso, su scale temporali che vanno da pochi picosecondi a diversi anni.



C harlotte Bunne La raccolta di dati e le banche dati sono una parte fondamentale del vostro lavoro attuale. Ma l’utilizzo dei dati dei pazienti per addestrare algoritmi di apprendimento automatico solleva chiaramente problemi di privacy. Come si può evitare questo lavoro e qual è la posizione della Svizzera al riguardo?

I dati dei pazienti richiedono naturalmente il massimo livello di precauzione. Vengono archiviati in ambienti informatici sicuri e le norme sulla protezione dei dati impongono requisiti rigorosi per la loro gestione ed elaborazione. Ciò che è piuttosto unico in Svizzera è il coordinamento delle iniziative per la creazione di infrastrutture di dati interoperabili che consentono l’accesso e lo scambio di dati sanitari in tutto il Paese. Questo pone le basi per lo sviluppo di algoritmi di IA su basi crescenti di dati diversi e rappresentativi dei pazienti. Il nostro lavoro si basa su questi notevoli sforzi e sugli ecosistemi sviluppati in Svizzera negli ultimi anni.

Un altro elemento fondamentale della nostra ricerca è la stretta collaborazione con biologi e clinici. Ciò significa che sviluppiamo le nostre soluzioni di intelligenza artificiale in stretta collaborazione e possiamo adattarle in modo che i nostri strumenti diagnostici si inseriscano perfettamente nei processi e nelle routine del mondo clinico. Allo stesso tempo, queste strette collaborazioni con biologi e clinici ci permettono di influenzare le future generazioni di dati in aree poco campionate o di dare priorità a determinati modi di misurare i dati che offrono approfondimenti sulla composizione molecolare di cellule e tessuti. Prevediamo che queste raccolte di dati guidate dall’intelligenza artificiale miglioreranno in modo significativo le capacità dei modelli di intelligenza artificiale che creiamo.

Lei è anche coinvolto in una comunità internazionale che cerca di sviluppare cellule virtuali dotate di intelligenza artificiale. Che cosa sono e come faranno progredire la scienza?

Esistono innumerevoli modi per effettuare misurazioni in biologia, su diverse scale fisiche, dalle interazioni molecolari all’architettura dei tessuti. La domanda a cui vorremmo rispondere è come integrare tutte queste misurazioni per ottenere un quadro e una comprensione completi della funzione e del comportamento delle cellule. Più specificamente, possiamo prevedere i cambiamenti nello stato molecolare di una cellula in presenza di una perturbazione esterna come una sostanza attiva, un’influenza ambientale, una malattia o un farmaco? In generale, vogliamo capire perché la cellula adotta un particolare stato piuttosto che un altro.

Grazie ai progressi delle tecniche di misurazione e alla crescente potenza delle architetture di intelligenza artificiale, stiamo iniziando a disporre degli strumenti per affrontare queste sfide. Alcuni di questi modelli di intelligenza artificiale sono costruiti su dati provenienti da misurazioni di singole cellule, mentre altri sono dedicati alla decodifica del linguaggio del DNA o del ripiegamento delle proteine. L’obiettivo è creare un modello di base multimodale e multiscala - una cellula virtuale alimentata dall’IA - che integri tutti questi sforzi e misurazioni e che rappresenti e simuli il comportamento di molecole, cellule e tessuti in una varietà di stati e condizioni. Una cellula virtuale di questo tipo funziona come un simulatore universale che ha imparato. È in grado di modellare i sistemi cellulari in base a vari scenari, che possono includere differenziazione, stati patologici, fluttuazioni stocastiche e influenze ambientali.

Si tratta di un enorme sforzo di collaborazione, che coinvolge una comunità scientifica globale. Molti gruppi stanno lavorando su diversi pezzi del puzzle. La nostra sfida e opportunità sta nell’integrare questi contributi in una visione coerente che spingerà indietro le frontiere di ciò che è possibile fare nella ricerca biomedica.

Se avesse una sfera di cristallo, cosa pensa che accadrà all’IA nelle scienze biomediche tra 10 anni? Cosa farete tra dieci anni?

Ci sono alcuni problemi più semplici in biologia che abbiamo già risolto e sui quali siamo in grado di fare previsioni accurate. Storie di successo come AlphaFold dimostrano che possiamo risolvere problemi specifici in modo isolato e mi aspetto altri progressi di questo tipo nei prossimi 10 anni. Ma comprendere appieno la complessità dei sistemi biologici è un compito monumentale. Questi sistemi coinvolgono innumerevoli interazioni molecolari che organizzano la dinamica generale alla scala del sistema stesso, su scale temporali che vanno da pochi picosecondi a diversi anni. Abbiamo un numero incalcolabile di problemi da risolvere e di domande a cui rispondere. Questo ci terrà impegnati per molti, molti anni a venire.

Riferimenti

La rivista Dimensions mette in luce l’eccellenza dell’EPFL attraverso approfondimenti, interviste, ritratti e notizie. Pubblicata 4 volte all’anno, in francese e in inglese, viene inviata ai membri degli Alumni contribuenti e a chiunque desideri abbonarsi. La rivista viene inoltre distribuita gratuitamente nei campus dell’EPFL.