Mithilfe von KI die bestmögliche medizinische Behandlung auswählen

- EN- DE - FR- IT
Charlotte Bunne. © Emphase / EPFL
Charlotte Bunne. © Emphase / EPFL
Um die Medizin voranzubringen, entwickeln Wissenschaftler der EPFL Diagnoseinstrumente, die auf künstlicher Intelligenz basieren. Ihr Ziel ist es, die beste Behandlung vorherzusagen, die Patientinnen und Patienten erhalten können.

An der EPFL entwickelt Charlotte Bunne, Leiterin der Gruppe für künstliche Intelligenz in der Molekularmedizin , Algorithmen, die die außerordentlich komplexen Daten von Hunderten von Gewebeschichten oder Markerproteinen in einer einzelnen Zelle verstehen. Das EPFL-Magazin Dimensions sprach mit der Forscherin über ihre Arbeit an der Spitze der Künstlichen Intelligenz in Medizin und Biologie.

Was sind die Ziele Ihrer Forschung?

Wir entwickeln ein klinisches Diagnoseinstrument, das auf KI-Technologien basiert. Es geht darum, die beste Behandlung für einen Patienten vorherzusagen, zu verstehen, in welchem Stadium der Krankheit er sich befindet, und Biomarker oder potenzielle Wirkstoffziele zu identifizieren, die näher betrachtet werden müssen. Wichtig ist, dass das molekulare Profil und folglich auch der mit dem Patienten verbundene Krankheitsphänotyp bei jedem Menschen einzigartig sind. Die Anpassung von Therapien an individuelle Molekularprofile erfordert Messungen, die die zellulären und molekularen Faktoren umfassen, die das Ansprechen auf die Behandlung beeinflussen, aber auch leistungsstarke KI-Technologien, die diese Faktoren zuverlässig aus großen, hochdimensionalen Datensätzen aus verschiedenen Experimenten vorhersagen können.

Und während wir die unglaublichen Leistungen der KI in den Bereichen Sehen und Sprache beobachten können, sehen die biologischen Daten ganz anders aus: Die Messungen sind indirekt, unklar und multimodal. Sie stellen lediglich Momentaufnahmen eines inhärent dynamischen Systems dar, das die zugrunde liegenden biologischen Prozesse steuert. Wir können die Technologien der sprachbasierten KI nicht einfach auf die Biologie anwenden. Wir müssen die Architekturen und Lernalgorithmen auf die Feinheiten der biologischen Modelle und Daten zuschneiden.

Während große neuronale Netze in Bezug auf ihre Vorhersagen oft Black Boxes sind, müssen wir sie so gestalten, dass wir zumindest verstehen können, welche biologischen Faktoren zu einer bestimmten Vorhersage beigetragen haben. Dieses Verständnis ist entscheidend für die Entdeckung von Biomarkern und Wirkstoffzielen, da es die mit der Krankheit verbundenen biologischen Mechanismen und Prozesse aufzeigt und so neue therapeutische Möglichkeiten eröffnet.

Wie haben Sie mit Ihrer Arbeit in diesem hochmodernen Bereich begonnen?

Ich habe früh angefangen! Mit 14 Jahren nahm ich an einem Stipendienprogramm für Gymnasiasten am Deutschen Krebsforschungszentrum teil und war fasziniert von meiner Arbeit im Bereich der synthetischen Biologie, einem Ansatz, der Ingenieurwesen, Informatik und Biotechnologie miteinander verbindet. Seitdem bin ich davon überzeugt, dass wir nur mit wirklich interdisziplinären Ansätzen unsere Ziele erreichen können. Und heute ist mein Lehrstuhl gemeinsam an die Fakultät für Informatik und Kommunikation und an die Fakultät für Biowissenschaften angegliedert.

Als Gymnasiasten veränderten wir einfache Bakterienzellen, um eine neue Funktion zu erhalten: So konnten wir sie als kleine Maschinen in einem bestimmten Produkt einsetzen. Jetzt möchte ich verstehen, wie wir menschliche Zellen so verändern können, dass sie diagnostische Eigenschaften erlangen, ihr Verhalten gegenüber Therapien vorhersagen oder sie von einem kranken in einen gesunden Zustand umprogrammieren können. Auch wenn also die Ziele, die Werkzeuge und vor allem der Grad der Komplexität nicht mehr mit der Arbeit meiner 14 Jahre vergleichbar sind, bleibt das Wesentliche gleich.

Dieser Forschungsbereich stellt eindeutig einen Beschleuniger für die Entwicklung der personalisierten Medizin dar. Hat er in den letzten Jahren mit dem Fortschritt der KI wirklich an Fahrt aufgenommen?

Ich bin eine junge Forscherin und habe mich daher einer Revolution angeschlossen, die bereits im Gange war. In letzter Zeit hat sich das Feld mit unglaublicher Geschwindigkeit verändert, weil wir jetzt biologische Hochdurchsatzdaten mit einer nie dagewesenen Auflösung generieren können. Die Organisation massiver Sätze biomedizinischer Daten bildet die Grundlage für das Training großer neuronaler Netze. So ist beispielsweise ein großer Teil des Erfolgs des letzten Nobelpreises für Chemie, der zum Teil Wissenschaftlern zugesprochen wurde, die das AlphaFold-Tool zur Vorhersage von Proteinstrukturen entwickelt haben, auf die Protein Data Bank zurückzuführen, eine große, für jedermann zugängliche Sammlung von Proteinstrukturen.

Unsere Forschung findet auf einer höheren Ebene statt, wo wir versuchen, biologische Funktionen und das Verhalten von Zellen und Geweben zu simulieren. Wir stützen unsere KI-Modelle auf Daten, die Hunderte von Merkmalen einzelner Zellen messen und uns Informationen über die subzelluläre Lokalisierung, das Vorhandensein oder die Häufigkeit bestimmter Proteine und Moleküle in einer Zelle liefern. Nach und nach integrieren wir diese besonders umfangreichen Daten in Datenbanken. Der Fortschritt beruht also auf zwei Elementen: der Verfügbarkeit zusätzlicher Proben und der Möglichkeit, hochauflösende, umfassende Daten menschlicher Zellen zu erhalten.

Dennoch arbeiten wir häufig noch mit niedrigen Datenregimen. Uns fehlen Datensätze, um z. B. dynamische zelluläre Prozesse über die Zeit und auf mehreren physikalischen Skalen zu erfassen. Insbesondere haben wir nicht viele Datenpaare, die molekulare Veränderungen mit Verhaltensweisen auf der Gewebeebene verbinden. Das bedeutet, dass wir bei der Entwicklung unserer KI-Systeme kreativ sein müssen, um diese Einschränkungen zu überwinden.

Das vollständige Verständnis der Komplexität biologischer Systeme stellt eine monumentale Aufgabe dar. Diese Systeme beinhalten unzählige molekulare Wechselwirkungen, die die allgemeine Dynamik auf der Ebene des Systems selbst organisieren, und zwar auf Zeitskalen, die von Pikosekunden bis zu mehreren Jahren reichen.

Charlotte Bunne


Das Sammeln von Daten und Datenbanken ist ein wesentlicher Bestandteil Ihrer derzeitigen Arbeit. Die Verwendung von Patientendaten zum Training von Algorithmen für maschinelles Lernen wirft jedoch eindeutig Probleme mit dem Schutz der Privatsphäre auf. Wie kann man sich von dieser Arbeit befreien, und wie steht die Schweiz diesbezüglich da?

Patientendaten erfordern natürlich das höchste Maß an Vorsicht. Sie werden in sicheren IT-Umgebungen aufbewahrt, und die Datenschutzbestimmungen stellen drastische Anforderungen an ihre Handhabung und Verarbeitung. Was in der Schweiz ziemlich einzigartig ist, ist die Koordination der Initiativen zum Aufbau interoperabler Dateninfrastrukturen, die den landesweiten Zugriff auf und den Austausch von Gesundheitsdaten ermöglichen. Dies legt den erforderlichen Grundstein für die Entwicklung von KI-Algorithmen auf einer wachsenden Basis verschiedener und repräsentativer Patientendaten. Unsere Arbeit profitiert von diesen enormen Anstrengungen und Ökosystemen, die in den letzten Jahren in der Schweiz entstanden sind.

Ein weiteres grundlegendes Element unserer Forschung ist der enge Austausch mit Biologen und Klinikern. Das bedeutet, dass wir unsere KI-Lösungen in enger Zusammenarbeit entwickeln und anpassen können, damit sich unsere Diagnosewerkzeuge nahtlos in die Prozesse und Routinen der klinischen Welt einfügen. Gleichzeitig ermöglicht uns diese enge Zusammenarbeit mit Biologen und Klinikern, Einfluss auf künftige Datengenerationen in unterbeprobten Bereichen zu nehmen oder bestimmte Arten der Datenmessung zu priorisieren, die tiefere Einblicke in die molekulare Zusammensetzung von Zellen und Geweben ermöglichen. Wir erwarten, dass solche von künstlicher Intelligenz gesteuerten Datenerhebungen die Fähigkeiten der von uns erstellten KI-Modelle deutlich verbessern.

Sie sind auch an einer internationalen Gemeinschaft beteiligt, die an der Entwicklung von virtuellen Zellen mit KI-Antrieb arbeitet. Worum geht es dabei und wie werden sie die Wissenschaft voranbringen?

In der Biologie gibt es unzählige Möglichkeiten, Messungen auf verschiedenen physikalischen Skalen durchzuführen, von molekularen Interaktionen bis hin zur Gewebearchitektur. Die Frage, die wir gerne beantworten möchten, ist, wie wir all diese Messungen integrieren können, um ein vollständiges Bild und Verständnis der Funktionen und des Verhaltens von Zellen zu erhalten. Genauer gesagt, können wir vorhersagen, wie sich der molekulare Zustand einer Zelle verändert, wenn eine externe Störung wie ein Wirkstoff, ein Umwelteinfluss, eine Krankheit oder ein Medikament vorliegt? Im Großen und Ganzen wollen wir verstehen, warum die Zelle einen bestimmten Zustand einnimmt und nicht einen anderen.

Mit den Fortschritten bei den Messverfahren und der zunehmenden Leistungsfähigkeit der KI-Architekturen verfügen wir nun allmählich über die Werkzeuge, um diese Herausforderungen zu bewältigen. Einige dieser KI-Modelle werden auf Daten aus Messungen isolierter Zellen aufgebaut, während sich andere mit der Entschlüsselung der Sprache der DNA oder der Proteinfaltung beschäftigen. Es geht darum, ein Grundmodell zu schaffen, das multimodal und mehrskalig ist - eine von der KI angetriebene virtuelle Zelle -, die all diese Bemühungen und Messungen integriert und das Verhalten von Molekülen, Zellen und Geweben in einer Vielzahl von Zuständen und Bedingungen darstellt und simuliert. Eine solche virtuelle Zelle arbeitet wie ein universeller Simulator, der gelernt hat. Sie ist in der Lage, Zellsysteme in verschiedenen Szenarien zu modellieren, die Differenzierung, pathologische Zustände, stochastische Fluktuationen und Umwelteinflüsse umfassen können.

Es handelt sich um eine massive gemeinschaftliche Anstrengung, an der eine weltweite wissenschaftliche Gemeinschaft beteiligt ist. Zahlreiche Gruppen arbeiten an verschiedenen Teilen dieses Puzzles. Unsere Herausforderung und Chance liegt darin, diese Beiträge in eine kohärente Vision zu integrieren, die die Grenzen des Möglichen in der biomedizinischen Forschung verschieben wird.

Wenn Sie eine Kristallkugel hätten, was glauben Sie, was in zehn Jahren mit der KI in der Biomedizin geschehen wird? Was werden Sie in einem Jahrzehnt tun?

Es gibt einige einfachere Probleme in der Biologie, die wir bereits gelöst haben und über die wir präzise Vorhersagen machen können. Erfolgsgeschichten wie AlphaFold zeigen, dass wir spezifische Probleme isoliert lösen können, und ich erwarte weitere Fortschritte dieser Art in den nächsten zehn Jahren. Das vollständige Verständnis der Komplexität biologischer Systeme ist jedoch eine monumentale Aufgabe. Diese Systeme beinhalten unzählige molekulare Wechselwirkungen, die die allgemeine Dynamik auf der Ebene des Systems selbst organisieren, auf Zeitskalen, die von einigen Pikosekunden bis zu mehreren Jahren reichen. Wir haben eine unüberschaubare Menge an Problemen, die wir lösen und Fragen, die wir beantworten müssen. Das wird uns noch viele, viele Jahre lang beschäftigen.

Referenzen

Das Magazin Dimensions hebt die herausragenden Leistungen der EPFL durch ausführliche Dossiers, Interviews, Porträts und Nachrichten hervor. Es erscheint viermal im Jahr auf Französisch und Englisch und wird an beitragende Alumni-Mitglieder sowie an alle Personen, die es abonnieren möchten, verschickt. Das Magazin wird auch kostenlos auf dem Campus der EPFL verteilt.