Jeden Tag verlässt eine astronomische Menge an wissenschaftlichen Daten die Labors der EPFL. Beispielsweise produzieren die Nutzerinnen und Nutzer von SCITAS, der Plattform für wissenschaftliches Computing der EPFL, pro Quartal 314’000 Gigabyte an Nutzdaten, die zwischen fünf und zehn Jahren aufbewahrt werden müssen.
Ohne eine hochmoderne IT-Infrastruktur wäre es unmöglich, diese Daten effizient zu verarbeiten. Doch obwohl die Leistung von Supercomputern immer weiter steigt, ist ihr CO2-Fußabdruck noch nicht auf dem absteigenden Ast. Die Entwicklung von Infrastrukturen, die sowohl leistungsstark als auch energiesparend sind, steht daher ganz oben auf der Tagesordnung.
Ein Supercomputer der EPFL auf der internationalen Bühne
Um diesem Bedarf gerecht zu werden, hat SCITAS Kuma entworfen, entwickelt und betreibt es weiterhin. Dieser Supercomputer ermöglicht Forscherinnen und Forschern einen privilegierten Zugang zu leistungsstarken und gleichzeitig umweltfreundlichen Hochleistungsrechenanlagen mit einer intuitiven, nutzerorientierten Benutzeroberfläche. Der Kuma-Cluster befindet sich im Rechenzentrum der Heizzentrale der EPFL, die das Wasser des Genfersees nutzt, um die Server zu kühlen und den Rest des Campus zu heizen."Dank Kuma baut die EPFL ihre Präsenz im Bereich der künstlichen Intelligenz und des nachhaltigen Rechnens weltweit weiter aus", erklärt Gilles Fourestey, operativer Leiter von SCITAS. "Die hohe Rechenleistung von Kuma ermöglicht es, Innovationen im Bereich des traditionellen wissenschaftlichen Rechnens zu beschleunigen, insbesondere bei wichtigen Anwendungen in den Bereichen Gesundheit, Klimaforschung, Materialwissenschaft und anderen kritischen Bereichen", ergänzt Michele Ceriotti, Direktor des wissenschaftlichen Lenkungsausschusses der Plattform.
Die Rechen- und Speicherinfrastruktur wurde von Lenovo erworben, das den technischen Support während der gesamten Lebensdauer des Supercomputers übernehmen wird. EcoCloud unterstützte die Entwicklung der Überwachungsinfrastruktur, um die Leistung des Supercomputers genau zu messen und seine Energieeffizienz zu charakterisieren.
"Für EcoCloud war die Zusammenarbeit mit SCITAS eine großartige Gelegenheit, die Forschung der EPFL im Bereich des nachhaltigen Computings auf die Entwicklung hochmoderner Supercomputer anzuwenden, die in unserem neuen Rechenzentrum eingesetzt werden können", erklärt David Atienza, ehemaliger wissenschaftlicher Leiter des EcoCloud-Zentrums und Associate Vice President für Zentren und Plattformen an der EPFL. "Dies ist ein hervorragendes Beispiel für die Teamarbeit zwischen der Associate Vice President for Centers and Platforms (AVP-CP) und der Vice President of Operations (VPO) bei der Gestaltung einer nachhaltigen IT-Infrastruktur. Darüber hinaus gibt das hervorragende Ergebnis in der Green500-Rangliste uns allen einen zusätzlichen Anreiz, diese Zusammenarbeit fortzusetzen."
Eine Mischung aus Leistung und Energieeffizienz
Auf der internationalen Bühne sticht Kuma durch seine Leistung hervor, da es im weltweiten Green500-Ranking auf Platz 23 steht und sogar den 10. Platz unter den ausschließlich akademischen Systemen erreicht. Es ist das erste Mal, dass sich die EPFL in dieser Rangliste positioniert, die die Energieeffizienz von Supercomputern anerkennt. Kuma belegt auch den 103. Platz in der Top500-Liste der leistungsstärksten Supercomputer der Welt, womit die EPFL nach acht Jahren Abwesenheit wieder in dieser Liste vertreten ist. Diese doppelte Anerkennung positioniert Kuma als eine der weltweit leistungsfähigsten und umweltfreundlichsten Plattformen für wissenschaftliches Rechnen.Basierend auf 334 NVIDIA-Grafikkarten der neuesten Generation, die auf 84 Server verteilt sind, die über ein Ultrahochgeschwindigkeitsnetzwerk (400 Gbit/s) miteinander verbunden sind, hat die H100-Partition des Kuma-Clusters einen Verbrauch von 18 Watt pro TFLOPS1. Zum Vergleich: Der IZAR-Cluster, sein Vorgänger in der Produktion zwischen 2020 und 2024, benötigte etwa 81 Watt pro TFLOPS.
Von der Lieferung von Kuma bis zur Bereitstellung für die Nutzerinnen und Nutzer vergingen weniger als 90 Tage - eine bemerkenswerte Leistung in diesem Bereich. Antonio J. Russo, Leiter der HPC-Systeme bei SCITAS, freut sich: "Dieses Ergebnis ist nicht nur ein Beweis für die hervorragende Zusammenarbeit zwischen der EPFL und Lenovo, sondern auch für die Fähigkeit von SCITAS, einen großen Katalog wissenschaftlicher Software mithilfe effektiver DevOps-Praktiken schnell zu beherrschen und bereitzustellen. Es spiegelt auch die sehr effektive Zusammenarbeit zwischen den verschiedenen Plattformen und Forschungszentren der EPFL, insbesondere SCITAS und EcoCloud, wider."
Ein weiterer Pluspunkt für das Schweizer HPC-Ökosystem.
Die Übernahme von Kuma ist Teil des Plans des Bundes, die Schweiz an der Spitze der für die wissenschaftliche Forschung bestimmten Rechenkapazitäten zu halten. Diese Initiative spiegelt das nachhaltige Engagement der Schweiz wider, ihren Wissenschaftlern den Zugang zu den leistungsstärksten Rechenwerkzeugen zu gewährleisten und damit ihre internationale Führungsrolle in der Forschung zu unterstützen.Kuma stärkt das Schweizer Ökosystem für Hochleistungsrechnen und stellt den Forscherinnen und Forschern der EPFL eine neue leistungsstarke Computerressource zur Verfügung. Der Cluster ergänzt den Supercomputer Alps, der kürzlich am Schweizerischen Nationalzentrum für Wissenschaftliches Rechnen (CSCS) in Lugano eingeweiht wurde. Alps, eine nationale Forschungsinfrastruktur, basiert ebenfalls auf der neuesten Generation von NVIDIA-Grafikkarten, erfüllt die höchsten Anforderungen an Rechenleistung und Datenverarbeitung und trägt zur nationalen Strategie der Schweiz im Bereich der KI bei. Kuma und Alps stärken die nationale Forschungsinfrastruktur und bieten Schweizer Wissenschaftlern einzigartige Werkzeuge, um wissenschaftliche Herausforderungen in großem Maßstab zu bewältigen.
Was wird aus dem ehemaligen IZAR-Cluster?
Seit mehreren Jahren engagiert sich die EPFL aktiv für einen umweltbewussten Ansatz, insbesondere bei der Verwaltung ihrer hochmodernen IT-Infrastruktur.Seit dem 1. November ist der IZAR-Cluster ausschließlich akademischen Aktivitäten gewidmet, wie z. B. der Ausbildung von Studenten in der Nutzung von numerischen Simulationstechnologien, die in der Forschung angewendet werden, oder den Semesterabschlussprojekten von Masterstudenten. Diese Umwidmung bereichert unser Bildungsangebot und verlängert gleichzeitig die Nutzungsdauer von Supercomputern, wodurch die Nutzung von IT-Ressourcen mit unseren Verpflichtungen zur Nachhaltigkeit in Einklang gebracht wird.
Darüber hinaus profitieren die Cluster für den akademischen Gebrauch, die weniger ausgelastet sind als die für die intensive Forschung, von einem Energieoptimierungssystem. Dieses schaltet nicht ausgelastete Komponenten automatisch ab und reduziert so den Energieverbrauch und die Umweltbelastung.
1 FLOPS ist eine Maßeinheit, die verwendet wird, um die Rechenleistung eines Computers oder Prozessors zu quantifizieren. Sie misst die Anzahl der Gleitkommaberechnungen, die in einer Sekunde durchgeführt werden können. 1 TFLOPS entspricht 1.000.000.000 Gleitkommaoperationen pro Sekunde.