Professore presso il Laboratorio di Imaging e Rappresentazione Visiva dell’EPFL dal 1999, l’informatico è anche membro del comitato direttivo del Centro di Imaging dell’EPFL e presidente del Consiglio svizzero della scienza.
Cosa non possiamo vedere oggi con la diagnostica per immagini?
Nell’imaging è tutta una questione di scala. Dall’infinitamente grande - lo spazio - all’infinitamente piccolo - l’atomo - passando per la struttura dei materiali o la diagnostica medica, ci aspettiamo progressi nella risoluzione spaziale, temporale e radiometrica. Con strumenti più sensibili in queste tre dimensioni, potremmo rilevare ancora più cose.
Per esempio?
Nel caso del telerilevamento, le apparecchiature di acquisizione sono sempre più potenti e ci permettono di effettuare analisi sempre più precise della composizione del suolo e del contenuto d’acqua. Questo ci aiuta a modellare meglio l’impatto delle colture, ad esempio, e a sviluppare soluzioni per un’agricoltura sostenibile.
Vorremmo anche individuare i tumori in fase precoce, comprendere meglio le interazioni nel cuore delle cellule, svelare i misteri del Big Bang e trovare tracce di vita sugli esopianeti. I progressi nella dimensione temporale, con velocità di mille fotogrammi al secondo o più, ci aiuteranno a decifrare meglio i movimenti e il comportamento di alcuni animali.
In che modo l’intelligenza artificiale gioca un ruolo decisivo nella generazione delle immagini?
Nello spazio, ad esempio, non appena viene commissionato un nuovo telescopio, si scoprono altre cose. Ma se siamo riusciti a scattare la prima immagine di un buco nero, è grazie all’intelligenza artificiale. È il risultato di un processo iterativo: gli strumenti scattano nuove immagini che permettono di addestrare l’IA, quest’ultima può poi ricostruire, gli strumenti vengono migliorati, l’IA viene addestrata con le nuove immagini e così via. Non si può avere l’uno senza l’altro.
La quantità di immagini è decisiva per l’IA. Abbiamo quindi bisogno di fotocamere in grado di scattare un gran numero di immagini.
E l’analisi?
In materia di analisi, quando l’IA è ben addestrata, è già migliore dell’uomo. Oggi il cancro al seno viene rilevato meglio dall’IA che dai radiologi. Abbiamo così tante mammografie che il sistema è estremamente ben addestrato. Ma è proprio questo il problema: se l’immagine mostra un tumore poco ricorrente o se il sistema non è stato addestrato con un numero sufficiente di esempi, l’IA probabilmente non lo troverà. Anche la diversità delle immagini è fondamentale per il buon funzionamento dell’IA. La massima affidabilità dipende dall’applicazione e da come vengono addestrati l’uomo e l’IA. Nessuna delle due è affidabile al 100%.
La simulazione potrebbe sostituire la diagnostica per immagini?
Grazie all’intelligenza artificiale, possiamo compensare i limiti delle acquisizioni fisiche. Possiamo ricostruire immagini migliori di quelle prodotte dagli strumenti fisici. Con la super-risoluzione, ad esempio, acquisiamo spazialmente con una certa risoluzione, e con l’IA possiamo ottenere una risoluzione 2, 4 o addirittura 8 volte più fine. Il sistema si basa sulle informazioni più probabili da seguire. Anche se si tratta di una simulazione o di un’imitazione, con un numero sufficiente di dati possiamo avere una probabilità abbastanza elevata che intorno a un pixel che abbiamo catturato si presentino tali e tante informazioni.
In questo modo, possiamo simulare cose che non possiamo ancora vedere con le immagini, ma c’è il pericolo che non abbiamo alcuna prova che questo sia corretto.
L’intelligenza artificiale può essere completamente sbagliata?
Certamente. L’IA crea un’imitazione con un’alta probabilità di essere corretta, ma non è un’informazione fisica, quindi un’immagine di questo tipo non dovrebbe essere usata in ricerche che intendono catturare segnali fisici reali. Si possono commettere lo stesso tipo di errori che il pubblico incontra con la ChatGPT. L’intelligenza artificiale lavora sull’addestramento: se non è stata addestrata a riconoscere un tipo di informazione o un tipo di immagine, non la troverà. Si limita a imitare ciò che ha già visto. Il problema è che l’intelligenza artificiale creerà sempre un’immagine o una risposta. Non dirà mai "non lo so". Quindi, più si è al di fuori del dominio, meno affidabile è la risposta del sistema, sia che si tratti di generazione, ricostruzione o analisi.
L’applicazione dell’IA all’imaging scientifico richiede trasparenza e correttezza.
S abine Süsstrunk L’IA sta mettendo a rischio la qualità e la credibilità delle pubblicazioni scientifiche?
È chiaro che la generazione di immagini può rendere più facile falsificare le cose. Detto questo, non abbiamo aspettato l’intelligenza artificiale per imbrogliare. Per molto tempo non c’è stata una scienza aperta né una questione di riproducibilità. È una questione di etica per il ricercatore.
Come si determina l’affidabilità dei risultati?
Sono sospettoso quando non è disponibile il codice e non è chiaro il tipo di dati utilizzati. Questi sono i criteri di riproducibilità. In effetti, non credo alla metà dei risultati delle grandi aziende. Farò un’eccezione per i risultati medici, perché non è sempre possibile pubblicare dati sensibili. Anche quando si dispone del codice, spesso non è possibile riprodurre i risultati. Si trova qualche punto percentuale in meno...
Si possono verificare imbrogli involontari applicando l’IA ai propri dati?
L’imaging sta assumendo un ruolo sempre più importante nella scienza in generale, poiché gli strumenti di analisi diventano sempre più potenti e sempre meno costosi. Ma per utilizzare correttamente l’IA è necessario avere una buona conoscenza dell’imaging ed essere consapevoli dei limiti dello strumento. Un profano può essere ingannato. La formazione è una responsabilità professionale. Il Centro di Imaging dell’EPFL è a disposizione per aiutare, offrendo corsi di formazione e scuole estive.
L’imaging ha reso possibile vedere l’invisibile a tutte le scale, ma l’IA sta creando l’inesistente con i deepfake?
È una questione di applicazione. I deepfake in sé non sono un pericolo, è il modo in cui vengono utilizzati che può esserlo, come la "viralizzazione" dei deepfake sui social network. La fotografia non ha aspettato l’IA per essere manipolata e per generare immagini di cose che non esistono. Le foto sono lì per piacere e tutto è permesso. Basta che sia visivamente plausibile. D’altra parte, anche le immagini scientifiche devono essere fisicamente realistiche, perché vengono utilizzate per misurare o visualizzare oggettivamente una grandezza fisica. Le immagini scientifiche non devono essere piacevoli, ma devono contribuire alla conoscenza di un determinato settore.
Infine, solo l’imaging ottico può creare un’immagine vera?
Sì, anche se l’immagine ottica può essere falsa, ad esempio se si commette un errore nell’acquisizione dei dati. Inoltre, il problema dell’immagine ottica è che contiene rumore. Quindi è sempre necessaria una ricostruzione, e se questa ricostruzione non viene eseguita correttamente, l’immagine ottica può risultare corrotta. Ma l’affidabilità dell’immagine ottica è migliore di quella generata dall’intelligenza artificiale.
La potenza di calcolo è una barriera?
La costruzione di modelli di intelligenza artificiale richiede molto tempo: ci sono miliardi di parametri da addestrare e ciò richiede un’enorme potenza di calcolo. Ecco perché solo i giganti come OpenAI o Meta possono permetterselo. Tuttavia, i modelli che utilizzano sono modelli di base, in grado di generare qualsiasi cosa, da testi e immagini a suoni e video. Nella ricerca, invece, ci concentriamo su modelli a compito singolo che possono, ad esempio, rilevare solo il cancro al seno o ricostruire immagini di risonanza magnetica. È molto più leggero. SwissAI ci permetterà di costruire questi modelli specifici.
Come si può migliorare l’IA?
La necessità di annotare i dati è un problema reale. Quando si mostrano a un bambino tre foto di gatti, il bambino sa come riconoscere un gatto. Un algoritmo ha bisogno di migliaia di immagini e gli esseri umani devono dirgli cosa rappresenta l’immagine perché possa imparare in modo affidabile. Oggi, se addestriamo un sistema senza annotare i dati, le prestazioni sono tre volte peggiori rispetto a quando i dati sono annotati. Abbiamo davvero bisogno di fare progressi in questo apprendimento auto-supervisionato, perché esclude una serie di applicazioni per le quali non abbiamo molti dati. Non succederà subito, ma ci arriveremo.
Cosa ci riserva il futuro?
Se potessi vedere il futuro, avrei già fondato la mia start-up! L’intelligenza artificiale ci aiuterà a sviluppare tecnologie di acquisizione migliori. Si tratta di un processo iterativo tra tecnologia e IA: un sensore migliore porta a un’analisi migliore, un’analisi migliore porta a sensori migliori... Questa relazione simbiotica ci permetterà di fare progressi in tutte le dimensioni, sia spaziali che temporali. Quando l’imaging progredisce, la scienza progredisce.