Strom sparen mit warmem Wasser und Daten
Strom sparen mit Daten und einer ausgeklügelten Kühlung: Etwa fünf Megawatt Strom verbraucht das Leibniz-Rechenzentrum (LRZ) in Hochzeiten, bis zu vier davon fließen in den SuperMUC-NG. Damit sie möglichst effizient verwendet werden und der Energiebedarf weiter sinkt, setzt das LRZ auf ein Kühlungssystem mit Warmwasser und auf Adsorptionstechnik. Inzwischen beschäftigen sich die IT-Forscher:innen mit Daten und künstlicher Intelligenz, um Supercomputer, Software und Anwendungen smarter und sparsamer zu betreiben. Ein Gespräch mit Michael Ott, promovierter Informatiker und Spezialist für energie-effizientes Computing, sowie Albert Kirnberger, der das Gebäudemanagement des LRZ leitet, über Strategien für ein energie-effizientes Supercomputing.
Warum ist der Energieverbrauch von Rechenzentren ein Thema für Forschung und Gebäudemanagement?
Dr. Michael Ott: Weil Computer und insbesondere Rechneranlagen viel Strom verbrauchen. Auch Rechenzentren wollen ihren Beitrag zu Nachhaltigkeit und Ressourcen-Schonung beitragen. Technik-Hersteller oder wirtschaftlich betriebene Rechenzentren sind aber meist in so enge Prozesse eingebunden, dass ihnen die Zeit zum Experimentieren fehlt. Da springen wir in die Bresche, schließlich stellt Energie-Effizienz für die Forschung viele spannende und notwendige Fragen.
Albert Kirnberger: Beim Computing wird Strom in Wärme umgewandelt, daher muss zusätzliche Energie aufgewendet werden, um die Systeme zu kühlen. Allein dafür verschleudern ineffiziente Rechenzentren ein Drittel ihrer Energie. Das vermeiden wir durch die Kühlung mit warmem und kaltem Wasser – durch die Analyse und Anpassung von Parametern wie Temperaturen oder Pumpendrehzahlen sowie bauliche Anpassungen konnten wir bei unseren Kühlsystemen den Stromverbrauch des LRZ erheblich reduzieren.
Wo setzen Sie an, um den Stromverbrauch des SuperMUC-NG zu senken?
Kirnberger: Einer der größten Energiefresser beim Betrieb eines Hochleistungsrechnern ist wie gesagt die Kühlung. Um dafür möglichst wenig Strom aufzuwenden, arbeiten unsere Supercomputer mit Hilfe einer ausgeklügelten Warm- und Kaltwasserkühlung sowie Adsorptionstechnik. Wir kühlen den SuperMUC-NG mit 45 Grad warmen Wasser. Dieses wird durch die Arbeit seiner rund 311.000 Prozessorkerne auf 55 Grad erhitzt, das bringt uns Energie zur Kühlung weiterer Komponenten mit Adsorptionstechnik sowie für die Heizung im LRZ. Durch die Optimierung der Wasserkreisläufe, die Kopplung von Kaltwassernetzen und durch die Regulierung von Wassertemperatur und -Menge verbrauchen wir deutlich weniger Strom zur Kühlung, wir können dadurch den Einsatz von Kältemaschinen zeitlich reduzieren und die Pumpen müssen bei geringerer Kältelast weniger Wasser umwälzen.
Ott: Die Hardware der Systeme ist ziemlich ausgereizt, noch passiert aber zu wenig mit den Programmen und Anwendungen. Werden Applikationen besser an die Supercomputer angepasst, sinkt der Energieverbrauch ebenfalls. Tools wie „Energy Aware Runtime“ oder EAR regeln beispielsweise Taktraten herunter, wenn diese nicht vollständig gebraucht werden. Denkbar wäre auch, Rechenaufträge besser zu organisieren und aufeinander abzustimmen um deren Durchsatz zu erhöhen. Dafür haben wir das Monitoring-Tool Data Center Data Base oder DCDB entwickelt und mit Wintermute um ein Werkzeug zur Klassifizierung und systematischen Auswertung der gesammelten Daten erweitert – das schafft mittelfristig die Grundlagen für eine smarte, künstlich intelligente Steuerung.
Welche Daten werden dafür wichtig?
Ott: DCDB vernetzt und harmonisiert Messwerte aus unterschiedlichsten Quellen, etwa die Temperatur, Leistung, Belastung von Prozessoren und anderer Computerkomponenten. Mit Hilfe von Wintermute können wir den Energieverbrauch einzelner Komponenten analysieren, Anomalien in den Rechnerknoten aufspüren und außerdem erkennen, welche Codes oder Anwendungen Engpässe beim Computing verursachen. Das ermöglicht Anpassungen, die sich positiv auf den Energieverbrauch auswirken. Je mehr Daten wir aus den Systemen sammeln und auswerten, umso mehr Hebelpunkte werden wir auch für mehr Energie-Effizienz finden.
Und wie geht es bei der Kühlung weiter?
Kirnberger: Mittelfristig werden wir alle Kühlsysteme auf den Betrieb mit Wasser umstellen und außerdem ältere Kälteanlagen durch energieeffizientere ersetzten. Darüber hinaus beobachten wir die Entwicklung bei den erneuerbaren Energien, und prüfen deren Einsatzmöglichkeit fürs Supercomputing