Le reti neurali sono algoritmi di apprendimento che si avvicinano alla soluzione di un compito allenandosi con i dati esistenti. Tuttavia, spesso non è chiaro come riescano a raggiungere questo obiettivo. Due giovani fisici di Basilea hanno ricavato formule che consentono di calcolare la soluzione ottimale senza la necessità di addestrare una rete. Questo non solo permette di capire come funzionano questi algoritmi, ma potrebbe anche aiutare in futuro a rilevare transizioni di fase sconosciute nei sistemi fisici.
Le reti neurali si ispirano al funzionamento del cervello. Tali algoritmi informatici, che imparano a risolvere compiti attraverso un addestramento ripetuto, possono, ad esempio, distinguere gli oggetti l’uno dall’altro o elaborare il linguaggio parlato.
Da alcuni anni i fisici lavorano all’utilizzo delle reti neurali per rilevare le transizioni di fase. Le transizioni di fase sono note nella vita di tutti i giorni, quando l’acqua congela in ghiaccio, ma esistono anche in forma più complessa, ad esempio tra gli stati di aggregazione di sostanze magnetiche o nei sistemi quantistici, dove spesso sono difficili da rilevare.
Julian Arnold e Frank Schäfer, due dottorandi del gruppo di ricerca di Christoph Bruder presso l’Università di Basilea, hanno ora ricavato da soli delle formule matematiche che permettono di rilevare queste transizioni di fase più rapidamente di prima. I risultati sono stati recentemente pubblicati sulla rivista Physical Review X.
Risparmiare tempo con una soluzione senza formazione
Una rete neurale apprende modificando sistematicamente i parametri nel corso di molte sessioni di addestramento, in modo che le previsioni calcolate dalla rete corrispondano sempre meglio ai dati di addestramento forniti dall’esterno. I dati di addestramento possono essere pixel di immagini o valori di misura di un sistema fisico di cui si vogliono conoscere le transizioni di fase.
Per cambiare questa situazione e fare luce sulla scatola nera di una rete neurale, Arnold e Schäfer hanno esaminato il caso speciale delle reti con un numero infinito di parametri, che in linea di principio eseguono un numero infinito di cicli di addestramento.
In linea di principio, è noto da tempo che le previsioni di tali reti tendono sempre a una certa soluzione ottimale. Arnold e Schäfer hanno utilizzato questo dato come punto di partenza per ricavare formule matematiche che consentono di calcolare direttamente la soluzione ottimale senza addestrare la rete. Questa scorciatoia riduce notevolmente il tempo di calcolo", spiega Arnold: "Il calcolo della nostra soluzione richiede solo il tempo di un ciclo di addestramento di una rete molto piccola. ’
Panoramica della rete
Oltre al risparmio di tempo, il metodo dei fisici di Basilea ha il vantaggio che le formule dedotte forniscono informazioni sul funzionamento delle reti neurali e quindi sui sistemi fisici da studiare. Finora, Arnold e Schäfer hanno testato il loro metodo su dati generati al computer. Nel prossimo futuro, si vuole applicare il metodo anche a dati di misura reali. In questo modo, in futuro si potrebbero scoprire transizioni di fase precedentemente sconosciute, ad esempio nei simulatori quantistici o in nuovi materiali.
Pubblicazione originale
Julian Arnold e Frank Schäfer
Sostituzione delle reti neurali con predittori analitici ottimali per il rilevamento delle transizioni di fase
Physical Review X (2022), doi : 10.1103/PhysRevX.12.031044