Auf dem Ozean treibende Trümmer, Entwaldung oder die Kartierung von Stadtgebieten: Mit einem Programm kann man anhand von nur wenigen Bildern ein neuronales Netz trainieren, das sehr schnell neue Elemente in Daten von Satelliten oder Drohnen unterscheidet.
Tierpopulationen untersuchen, die Vegetation quantifizieren, auf der Meeresoberfläche treibende Abfälle sichtbar machen, die Entwicklung von Gletschern überwachen... Bilder von Drohnen oder Satelliten liefern eine unerschöpfliche Fülle von Informationen, die uns helfen, die Vorgänge auf der Erdoberfläche besser zu verstehen. Neuronale Netze sind in der Lage, die gewünschten Elemente zu finden und zu klassifizieren, nachdem sie von Spezialisten trainiert wurden. "Aber es gibt kein Programm, das die KI schnell von der Erkennung eines Trümmerteils auf die eines Baumes oder Gebäudes umstellt", sagt Devis Tuia, Professor an der EPFL. "Derzeit müssen die Forscher das Lernen für jedes neue Thema erneut beginnen, indem sie ihm große Mengen an Felddaten zur Verfügung stellen." Zusammen mit seinen Kollegen vom Labor für Computational Science for Environment and Earth Observation sowie Wissenschaftlern derUniversität Wageningen (NL), dem MIT , Yale und dem Forschungszentrum Jülich (D) entwickelte er das Chamäleon-Lernsystem METEOR, das anhand einer Handvoll Bilder von einem Objekttyp zum anderen wechseln kann.
Wir haben Algorithmen und Techniken entwickelt, die es Modellen ermöglichen, aus früheren Erfahrungen zu verallgemeinern und dieses Wissen auf neue Situationen anzuwenden.
Marc Rußwurm
Vier oder fünf Bilder von guter Qualität reichen aus, um das System für eine neue Aufgabe neu zu trainieren.
Bilderkennungsaufgaben, die von künstlichen Intelligenzen vom Typ neuronaler Netze durchgeführt werden, erledigen im Handumdrehen die Klassifizierungsarbeit, für die Menschen Stunden brauchen würden. Diese Programme stützen sich auf von Menschen annotierte Trainingsdaten, um zu lernen und ihre Genauigkeit nach und nach zu verbessern. Ein Baum oder ein Gebäude zum Beispiel können sehr unterschiedliche Darstellungen haben, je nachdem, aus welcher Region die Daten stammen. Eine große Menge an Bildern desselben Elements, die unter verschiedenen Bedingungen aufgenommen wurden, ist daher im Prinzip notwendig, um eine gute Zuverlässigkeit zu gewährleisten. "Dennoch ist es bei vielen Problemen in den Umweltwissenschaften nicht möglich, ein ausreichend großes Datenpaket zu erhalten. Zum Beispiel, wenn es sich um ein lokales Problem handelt, wie das Verschwinden einer bestimmten Baumart an diesem Ort oder das Auffinden von Trümmern imDer ehemalige EPFL-Postdoktorand Marc Rußwurm, heute Assistenzprofessor an der Universität Wageningen (Niederlande), stellt fest: "Es ist wichtig, dass wir uns mit der Frage beschäftigen, ob es sich um ein Problem handelt, das überall auftritt, aber nicht sehr zahlreich ist, wenn man es statistisch betrachtet.
Ein weiterer Stolperstein für das Lernen ist die Anpassung der KI an unterschiedliche räumliche Auflösungen und Spektralbänder sowie an die Art des Geräts (z. B. Satelliten oder Drohnen). METEOR ist ein anpassungsfähiges System, das zum Meta-Lernen fähig ist: Es nimmt Abkürzungen auf der Grundlage von vorherigen Aufgaben, die bereits in anderen Kontexten erfolgreich waren. "Wir haben Algorithmen und Techniken entwickelt, die es den Modellen ermöglichen, aus früheren Erfahrungen zu verallgemeinern und dieses Wissen auf neue Situationen anzuwenden", erklärt der Forscher. Für eine neue Suche reichen vier oder fünf Bilder von guter Qualität aus, um das Modell ausreichend zuverlässig zu machen.
Ein Modell, das sich über die Unterschiede in der Auflösung hinwegsetzt.
Um die Fähigkeiten ihres Programms zu testen, modifizierten die Wissenschaftler eine bestehende KI, die darauf trainiert war, die Landbedeckung weltweit zu klassifizieren, so, dass sie mit einer minimalen Lernphase fünf sehr unterschiedliche Aufgaben lösen konnte: Ortung der Pflanzendecke in Australien, Unterscheidung von Abholzungsgebieten im Regenwald in Brasilien, Erkennung von Veränderungen in Beirut zwischen vor und nach einer Explosion im Jahr 2020, Ortung von Meerestrümmern im ?und die Einteilung von Stadtgebieten in verschiedene Arten der Landnutzung (dicht, mittel und dünn besiedelte Industrie-, Gewerbe- und Wohngebiete), jeweils auf der Grundlage einer kleinen Anzahl von Bildern, die je nach Problemstellung zwischen hochauflösenden und Satellitenbildern gemischt werden. "Bei diesen Aufgaben, bei denen die Anzahl der Daten begrenzt ist, sind die Ergebnisse in jedem Fall mit denselben Daten vergleichbar, die auf lange trainierten Programmen verarbeitet werden", stellt er fest. In Zukunft wollen die Forscher die Basis-KI auf eine Vielzahl von Aufgaben trainieren, damit sie ihre Cameofähigkeiten weiter perfektionieren kann. Auf diese Weise kann sie sich noch leichter an unzählige Erkennungsaufgaben anpassen. Andererseits würde es auch eine Verbesserung bedeuten, sie in einen Bereich der Interaktion mit Menschen zu integrieren, in dem es die Menschen sind, die einige vom System vorgeschlagene Bilder in guter Qualität anklicken. "Da das System nur einige wenige Bilder sieht, ist die Relevanz dieser Bilder sehr wichtig", sagt Marc Rußwurm.
Referenzen
Marc Rußwurm, Sherrie Wang, Benjamin Kellenberger, Ribana Roscher, Devis Tuia. Meta-learning to address diverse Earth observation problems across resolutions. Nature communications earth & environment. January 12, 2024. DOI: 10.1038/s43247’023 -01146-0.