terrabyte: Innovative Werkzeuge zur Erforschung der Erde
Die High-Performance Data Analytics-Plattform terrabyte von DLR und LRZ startet in den Regelbetrieb
- terrabyte kombiniert enorme Rechenkapazitäten mit großen Speichern und schnellen Daten-Verbindungen
- Die Hochleistungsplattform bietet praktische Analyse-Werkzeuge und ist für die Auswertung von Satellitendaten optimiert
- Mit Hilfe von terrabyte können Verkehrsplanungen, der Katastrophenschutz und die Stromversorgung verbessert werden.
Forschung und Wissenschaft können nun einen riesigen Datenschatz, prall gefüllt mit Informationen über den Zustand der Erde, heben: Das Deutsche Zentrum für Luft- und Raumfahrt (DLR) und das Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften geben den Start von terrabyte bekannt. Auf dieser High Performance Data Analytics-Plattform (HPDA) können Forschende in Bayern und Deutschland künftig Satelliten- und Erderkundungsdaten für klassische Simulationen berechnen oder mit Methoden der Künstlichen Intelligenz (KI) auswerten. Gefördert wird die innovative Plattform mit Mitteln des Bayerischen Staatsministerium für Wissenschaft und Kunst (StMWK) sowie des Bundesministeriums für Wirtschaft und Klimaschutz (BMWK).
Dazu kombiniert terrabyte klassische Prozessoren (CPU) mit Beschleunigern und Graphics Processing Units (GPU). Den Kern der innovativen Plattform bilden ThinkSystem SD650-N V2-Server sowie DSS-G-Speicher von Lenovo. Für Modellierungen, Berechnungen und Analysen mit KI-Methoden enthalten sie neben 61 CPU-Knoten mit je zwei 40-Kern Intel Xeon Platinum-Prozessoren noch 15 GPU-Knoten mit jeweils vier A100-Beschleunigern von NVIDIA. Durch Infiniband HDR-Verbindungen kann terrabyte Daten mit einer Geschwindigkeit von 320GB/s verarbeiten. Über eine direkte Netzanbindung mit 100 Gigabit pro Sekunde fließen die Daten aus dem Deutschen Satellitendatenarchiv des DLR in Oberpfaffenhofen auf die terrabyte-Plattform am LRZ in Garching. Mit dieser Ausstattung erreicht die HPDA-Plattform eine Leistung von bis zu 1,3 Petaflops, sie bewältigt pro Sekunde bis zu 1,3 Billiarden Gleitkommaberechnungen. Bis Herbst wird die Leistung von terrabyte mehr als verdoppelt. Für den energie-effizienten Betrieb sorgt eine Warmwasserkühlung.
So einfach zu nutzen wie Cloud-Dienst
Nach dem Vorbild des LRZ Data Science Storages (DSS) ergänzen rund 50 Petabyte Online-Speicher die Plattform. Neben dem Betriebssystem integriert das LRZ auf terrabyte den Softwarestack für seine Hoch- und Höchstleistungsrechner, außerdem oft eingesetzte, frei verfügbare Anwendungen fürs High-Performance Computing (HPC). Zudem finden Nutzer:innen auf terrabyte Open Source Software, Werkzeuge und Algorithmen des Earth Observation Centers (EOC) und von weiteren DLR-Instituten, mit denen sich unterschiedlichste Geoinformationen verarbeiten oder Anwendungen des maschinellen Lernens trainieren lassen. Forschende können außerdem eigene Algorithmen implementieren und nutzen.
Mit einer Kennung des LRZ können Nutzer:innen des DLR sowie Wissenschaftler:innen aus Bayern auf terrabyte online zugreifen und dort Datensätze sowie eigene Berechnungen so komfortabel verwalten wie bei bekannten Cloud-Diensten. Ein großer Teil der Satellitendaten ist vorverarbeitet und kann in vorinstallierten Applikationen verwendet werden (so genannte Analysis Ready Data, ARD). terrabyte ermöglicht damit eine Vielfalt von geowissenschaftlichen Analysen, die bislang aufgrund der Datenmengen und begrenzter Rechenleistungen nur auf kommerziellen Plattformen möglich waren.
Daten verbessern Planungen und Katastrophenschut
Der Datenschatz des DLR beinhaltet historische Informationen aus 50 Jahren Erderkundung sowie aktuelle Radar- und Multispektralbilder, die Satelliten täglich zur Erde schicken. Auf ihnen basieren Forschungsprojekte wie der „World Settlement Footprint“ des DLR, der die Entwicklung von Siedlungen seit 1985 weltweit und insbesondere von Metropolen und Megacities wie Kairo, Mumbai oder Rio de Janeiro in 3D nachvollzieht und damit Stadt- sowie Verkehrsplanungen unterstützt. Die Datensätze aller Berechnungen seit 2015 sind heute Standard und werden von den Vereinten Nationen, der Weltbank und vielen anderen Institutionen eingesetzt.
Mit Hilfe von Satellitendaten lassen sich heute zudem – regional und weltweit – Standorte für Offshore-Windanlagen evaluieren und deren Betrieb untersuchen. So kann der Beitrag dieser Anlagen zur nationalen Stromgewinnung besser eingeschätzt werden. Eine besondere Bedeutung haben Erdbeobachtungsdaten außerdem im Katastrophenschutz: Satelliten liefern heute Hinweise zum Zustand, etwa der Trockenheit von Wäldern, mit denen Warnungen und Maßnahmen gegen Waldbrände geplant werden können.
Das DLR investierte mit Bundesmitteln rund 19 Millionen Euro in den Auf- und Ausbau von terrabyte. Das LRZ stellt den Betrieb der High Performance Data Analytics-Plattform sicher, übernimmt die laufenden Betriebskosten und bringt beträchtliche Personalressourcen ein – alles mit Finanzierung über das Bayerische Ministerium für Wissenschaft und Kunst.
Stimmen zu terrabyte:
Anlässlich der feierlichen Inbetriebnahme von terrabyte am 14.06.2023 am LRZ zeigten sich hochrangige Vertreter:innen aus Wissenschaft beeindruckt von terrabyte.
„terrabyte ist ein großer Schritt für die zukünftige Geoinformationsforschung. Big Data, neueste KI-basierte Verarbeitungsmethoden und High-Performance Computing sind auf einzigartige Weise vereint. terrabyte bildet nicht nur das Fundament für unsere Wissenschaft, sondern ist auch ein entscheidender Wirtschaftsfaktor für Bayern und Deutschland. Basis dafür ist die Kooperation mit unseren Partnern und der damit verbundene Wissenstransfer“, sagt Prof. Dr.-Ing. Anke Kaysser-Pyzalla, Vorstandsvorsitzende des DLR.“
Prof. Dr.-Ing. Anke Kaysser-Pyzalla, Vorstandsvorsitzende des DLR
„Mit dem Leibniz-Rechenzentrum haben wir den idealen Kooperationspartner für dieses herausfordernde Projekt gefunden. Mit terrabyte haben wir eine autonome und sichere Plattform mit umfassend globalen Datenbeständen aus der Erdbeobachtung, die wir zusammen mit unseren Partnern erschließen können. Gleichzeitig bildet terrabyte eine technologische Brücke zwischen den Standorten Oberpfaffenhofen und Garching.“
Prof. Dr. Stefan Dech, Direktor des Deutschen Fernerkundungsdatenzentrums am DLR
„terrabyte ist die Antwort auf die diversen Anforderungen an effiziente Datenhaltung, Data Science, KI und Cloud-Services bis hin zum Hoch- und Höchstleistungsrechnen. Mit unserem langjährigen Know-how in diesen Bereichen verbinden wir die Technologien zu einem maßgeschneiderten Dienst für die Erdbeobachtung. Von der riesigen Menge an historischen und aktuellen Satellitendaten profitieren via terrabyte nicht nur Forschende des DLR, sondern bayerische und deutsche Wissenschaftler:innen. Ein sehr spannendes, aber auch forderndes Projekt – das nur möglich war durch die intensive und hervorragende Zusammenarbeit von Kolleg:innen des DLR und des LRZ.“
Prof. Dr. Dieter Kranzlmüller, Leiter des LRZ