KI beschleunigt HPC: LRZ erweitert das KI-Angebot für Wissenschaft und Forschung

Die Ausbaustufe von SuperMUC-NG – die Phase 2 – ist im Leibniz-Rechenzentrum installiert, wird nun auf Herz und Nieren getestet und geht im Frühjahr in den Betrieb

SNG-2-Seite-s


Am Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften (BAdW) wurde die Erweiterung des aktuellen Spitzenrechners installiert: SuperMUC-NG Phase 2, kurz SNG-2, integriert und treibt künstliche Intelligenz (KI) im Hochleistungsrechnen voran. Laut der aktuellen Top500-Liste vom November 2023 ist der Computer das viertschnellste Supercomputing-System in Deutschland, seine Leistungen können über das Gauss Centre for Supercomputing (GCS) beantragt werden: "Wir erweitern SuperMUC-NG mit KI-Fähigkeiten, um bahnbrechende wissenschaftliche Entdeckungen zu ermöglichen und zu beschleunigen, und zwar erstklassige HPC- und KI-Projekte der Lebens-, Umwelt-, Materialwissenschaften sowie aus vielen weiteren Forschungsbereichen", kommentiert Prof. Dr. Dieter Kranzmüller, Leiter des LRZ.

SNG-2 wurde entwickelt, um die in Forschung und Wissenschaft stärker nachgefragten KI-Methoden in etablierte HPC-Workflows zu integrieren. Das System bietet durch die enthaltenen Graphics Processing Units (GPU) gleichzeitig eine Beschleunigung bei klassischen Modellierungs- und Simulationsaufgaben in vielen Wissenschaftsdisziplinen. Das System eignet sich besonders gut für hoch skalierbare, rechen- und datenintensive Workloads. Der von Intel und Lenovo entwickelte und gelieferte Supercomputer enthält 240 Rechenknoten, die auf Lenovos ThinkSystem SD650-I V3 Neptune DWC Servern basieren. Er verfügt über 480 Intel-CPUs sowie 960 Intel-GPUs, die durch Lenovos Neptune-Technologie heißwassergekühlt werden. Darüber hinaus verfügt der Supercomputer über ein verteiltes, asynchrones Objektspeichersystem (DAOS), das Intel Xeon Scalable Prozessoren der dritten Generation und den persistenten Intel Optane Speicher nutzt, um den Zugriff auf große Datenmengen zu beschleunigen.



Systemauslastung maximieren

Die Systeme des LRZ werden traditionell von Anwender:innen aus unterschiedlichsten Fachdisziplinen äußerst stark genutzt. Damit auch SNG-2 breit eingesetzt wird und um die neuen Möglichkeiten und Workflows mit KI-Verfahren Forschenden näher zu bringen, hat das LRZ in den letzten Jahren sein KI-Trainingsangebot deutlich ausgebaut. Speziell für die Nutzer:innen des SNG-2 sind in Zusammenarbeit mit Intel für Frühjahr 2024 weitere Kurse geplant. Darüber hinaus hat das LRZ das Computational X- sowie das Big Data- und KI-Team mit Spezialist:innen für Machine Learning (ML), Large Language Models (LLM) und Surrogatmodelle erweitert. Sie unterstützen Forschende gezielt bei ihren Projektvorhaben und begleiten sie beratend.


Testphase vor dem zuverlässigen Betrieb

Gerade wird das System auf Herz und Nieren geprüft, gleichzeitig wird eine Friendly-User-Testphase vorbereitet, in der die Nutzung des SNG-2 getestet und optimiert wird. Betriebsstart für alle Nutzer:innen wird im Frühjahr 2024 erwartet. Phase 1 und Phase 2 von SuperMUC-NG werden beide in Betrieb bleiben, bis das Nachfolgesystem einsatzfähig ist. SNG-2 wurde vom Bundesministerium für Bildung und Forschung (BMBF) und dem Bayerischen Staatsministerium für Wissenschaft und Kunst (StMWK) finanziert. Die Rechenzeit wird über Ausschreibungen des Gauss Centre for Supercomputing (GCS) zur Verfügung gestellt.


Mehr zu den technischen Spezifikationen erfahren Sie auf unserer Dokuplattform. Erste visuelle Eindrücke gibt es in diesem Clip.