

Mit Hilfe der Compute Cloud, dem Infrastructure-as-a-Service (IaaS) Angebot des LRZ, können individuelle virtuelle IT-Infrastrukturen zur Lösung von Aufgaben im Bereich des wissenschaftlichen Rechnens, der Ausbildung und der Verarbeitung großer Datenmengen erstellt werden. Dabei soll der Zugriff auf Compute-Ressourcen im Rahmen eines LRZ-Projekts möglichst unkompliziert sein.
Der Betrieb erfolgt nach dem “Best Effort”-Prinzip. Bei kritischen Diensten mit Forderung nach hoher Ausfallsicherheit empfiehlt sich deshalb unsere Dienstleistung “Managed Server” mit einer zugrundeliegenden VMware-Infrastruktur.
Es besteht die Möglichkeit zum Betrieb eigener Hardware, die nach den Vorgaben des LRZ über das Cloud-Team beschafft wird; siehe hierzu Kapitel “Attended Compute Cloud Housing”. Ansonsten stehen die verfügbaren Ressourcen allen Interessenten grundsätzlich gleichberechtigt zur Verfügung.
Über ein Self-Service-Portal und Schnittstellen, sog. APIs, können Infrastruktur-Ressourcen provisioniert und verwaltet werden. Dazu gehören beispielsweise virtuelle Maschinen (VMs), Netze oder Speicherressourcen. Jeder Nutzer erhält vollständigen Administratorzugriff auf seine virtuelle Infrastruktur, kann eigene Software installieren und ist selbst für die Konfiguration und die Sicherheit seiner Systemumgebung verantwortlich. Werden für den Betrieb von Software in der VM Lizenzen benötigt, ist der Anwender für die korrekte Lizenzierung allein verantwortlich.
Flavors werden verwendet, um die Zuteilung von Ressourcen an eine VM zu regeln. Einem Flavor ist eine bestimmte Anzahl an CPUs, ein gewisser Teil des Hauptspeichers usw. zugeordnet. Es beinhaltet daher alle Ressourcen einer physischen Maschine oder einen Bruchteil davon, z. B. 1/1, 1/2, 1/4, 1/10, 1/20, 1/40. Darüber hinaus legen Flavors fest, auf welcher physischen Hardware VMs zur Ausführung kommen. Es ist nicht möglich, individuell konfigurierte Flavors bereitzustellen.
Standardmäßig haben die Nutzer nicht auf alle zur Verfügung stehenden Flavors Zugriff, sondern nur auf jene, die in Abhängigkeit ihrer Quotas (s. nächster Abschnitt) einsetzbar sind. Dies betrifft Flavors, die große Teile der Compute Nodes oder GPUs bereitstellen. Will ein Nutzer eine solche VM betreiben, muss er sich im Vorfeld mit dem LRZ in Verbindung setzen, da nicht nur der Zugriff auf die Flavors freigeschaltet, sondern auch das Quota des Nutzers erhöht werden muss.
Quotas stellen eine Limitierung von Ressourcen dar, die von einem User gleichzeitig genutzt werden können.
Durch die Verwendung von Quotas wird verhindert, dass einzelne Nutzer die Systeme auslasten und Compute-Nodes mit anderen VMs blockieren. Zudem wird ein Bewusstsein für die physischen Kapazitätsgrenzen der Compute Cloud geschaffen. Eine Anpassung von Quotas ist möglich; bei besonders rechenintensiven Projekten können Sie eine Anfrage zur Quota-Erweiterung stellen.
Das Default-Quota ist so gesetzt, dass die meisten LRZ-Projekte damit zurechtkommen. Es orientiert sich an der Charakteristik der Compute-Nodes und soll den typischen Ressourcenbedarf der Nutzer widerspiegeln:
Default Quota | Menge |
---|---|
Anzahl VMs | 4 |
Anzahl Cores | 10 |
Größe Hauptspeicher | 45 GB |
Anzahl GPUs | 0 |
Anzahl Volumes | 4 |
Storage (Ceph) | 200 GB |
Dies bedeutet, dass ein Nutzer maximal 4 VMs gleichzeitig starten kann, die insgesamt maximal 10 virtuelle CPU-Kerne verwenden. Er kann beispielsweise mehrere kleinere VMs starten (z.B. 2x lrz.large + 1x lrz.medium) oder eine größere mit 10 Kernen (lrz.xlarge).
Wie beschrieben, kann das Quota für einzelne Projekte erhöht werden, z.B. falls ein User eine GPU in einer seiner VMs verwenden möchte. Diese Anfrage muss von einem Master User des Projekts gestellt werden.
Eine Überschreitung der Quota ist nicht möglich; in diesem Fall wird der Start neuer VMs bzw. das Anlegen neuer Volumes durch OpenStack verhindert.
Damit eine virtuelle Maschine gestartet werden kann, muss (einer) der Master User des LRZ Projekts sowohl ein Projektbudget als auch das Budget des einzelnen Nutzers auf einen Wert größer 0 setzen. Neue LRZ-Projekte und Kennungen in einem Projekt werden immer mit einem Budget von 0 initialisiert.
Die Budgetierung dient zur Sicherstellung, dass durch die Nutzung der LRZ Compute Cloud mehr Kosten anfallen, als von der durchführenden Einrichtung des LRZ Projekts bewilligt wurden. Das zusätzliche Nutzer-Budget ermöglicht die Kostenlimitierung auf Nutzerbasis, z.B. für die Durchführung von Abschlussarbeiten.
Das LRZ behält sich das Recht vor, VMs und Daten von Projekten sowie Benutzern zu löschen, sofern diese vor mehr als drei Monaten deaktiviert bzw. gelöscht wurden oder deren Budget seit mehr als drei Monaten aufgebraucht ist.
Die Nutzer sind selbst dafür verantwortlich, die Daten rechtzeitig zu sichern.
Angeboten wird ein Self-Service-Zugriff auf Management-Funktionalität der Cloud über ein Web-Interface und APIs zur Erzeugung und Verwaltung von virtuellen Infrastruktur-Komponenten wie
Wie bereits oben beschrieben, können in der Compute Cloud verschiedene Flavors verwendet werden, die unterschiedlichen Hardwaretypen und Anteilen entsprechen. Ein Flavor legt die zur Verfügung gestellte Konfiguration fest, z. B. Anzahl virtueller CPUs, Größe des RAMs oder Zusatzkomponenten wie GPUs.
In der Compute Cloud findet eine Überprovisionierung der CPUs statt, um die Bedürfnisse möglichst vieler Anwender zur erfüllen. Der Hauptspeicher wird nicht überprovisioniert.
Das LRZ stellt aktuelle Betriebssystem-Images für mehrere freie Linux-Varianten sowie FreeBSD zur Verfügung, deren Lauffähigkeit und Kompatibilität mit der Umgebung geprüft wurde (u.a. Ubuntu, Debian, CentOS, Fedora, FreeBSD). Diese Images stammen direkt aus den Quellen des jeweiligen Linux Distributors und werden vom LRZ nicht verändert oder angepasst, siehe https://docs.openstack.org/image-guide/obtain-images.html.
Darüber hinaus können eigene Betriebssystem-Images in die Cloud hochgeladen und genutzt werden, die mit der virtuellen Hardware x86_64-kompatibel sind.
Der Kunde ist für die korrekte Lizenzierung des Betriebssystems und der Software in der VM verantwortlich.
Bei der Compute Cloud handelt es sich um ein IaaS-Angebot. Das LRZ bietet keinen Support für die Konfiguration der VMs und für Software innerhalb der VMs.
Blockbasierter Speicherplatz wird für Betriebssystem-Images, Systemlaufwerke der virtuellen Server und Datenvolumes zur Verfügung gestellt.
Der Speicherplatz ist durch Redundanz vor dem Ausfall von bis zu zwei Komponenten geschützt, das LRZ erstellt aber keine Backups.
Es können Snapshots und Klone durch die Nutzer selbst erstellt werden, diese ersetzen aber keine vom Kunden durchzuführende Datensicherung.
Für die Verwaltung von Datenmengen über 1 TiB wird die Nutzung anderer Speicherangebote empfohlen, z. B. der Cloud Storage (vgl. Abschnitt 7.1) oder der Data Science Storage (DSS, vgl. Abschnitt 7.3) für Datenmengen ab 20 TiB.
Kunden können entweder ein allgemein zur Verfügung gestelltes Netz verwenden oder eigene Netze erstellen und nutzen.
Sogenannte Security Groups isolieren die eigenen virtuellen Server, auch wenn diese in einem gemeinsamen Netz betrieben werden und erfüllen eine ähnliche Funktion wie Firewalls. Sie sind vollständig durch die Nutzer konfigurierbar. Der Netzzugriff von und auf die virtuelle Infrastruktur wird vom LRZ nicht eingeschränkt.
Für externen Zugriff auf eigene Server und Dienste werden sogenannte Floating-IPs verwendet; diese können aus einem MWN-internen oder weltweiten IPv4-Adressbereich kommen.
Kundenprojekte sind mit Ressourcenlimits ausgestattet, die die Anzahl der möglichen virtuellen Server und Netze, den verfügbaren Arbeitsspeicher usw. beschränken. Die Änderung der Limits kann durch einen Master User über den Servicedesk beantragt werden.
Generell wird nicht zugesichert, dass eine bestimmte Menge an Ressourcen zu einem Zeitpunkt bereitgestellt werden kann. Die Cloud wird nach dem Best-Effort-Prinzip betrieben.
Dieser Dienst wird den folgenden Nutzerklassen zur Verfügung gestellt. Hierbei sind von den einzelnen Nutzerklassen folgende Gebühren zu tragen:
Nutzerzklasse | Kostensatz |
---|---|
1 | Selbstkosten (Betriebs- + Investitionskosten) |
2 | Selbstkosten (Betriebs- + Investitionskosten) |
3 | Selbstkosten (Betriebs- + Investitionskosten) |
4 | Vollkosten (Selbst- + Gemeinkosten) |
5 | Vollkosten (Selbst- + Gemeinkosten) |
6 | Vollkosten (Selbst- + Gemeinkosten) |
Die Benutzung der LRZ Compute Cloud ist kostenpflichtig, abhängig von den verwendeten Ressourcen.
Bei der Erstellung einer VM gibt der Benutzer an, mit welchem Flavor diese erzeugt werden soll. Das Flavor regelt unter anderem die Ressourcenzuteilung zu der VM, also die Anzahl an CPU-Kernen, die Größe des Hauptspeichers und ob eine GPU bereitgestellt wird.
Das LRZ stellt unter anderem die folgenden Flavors für die Verwendung von Kunden-VMs zur Verfügung, die abhängig von den bereitgestellten Ressourcen unterschiedliche Preise haben. Eine vollständige Liste aller verfügbaren Flavors findet sich auf der Dokumentationsplattform.
Name | vCPUs | RAM | GPUs | (S) pro Tag | (V) pro Tag | (S) pro Jahr | (V) pro Jahr |
---|---|---|---|---|---|---|---|
lrz.tiny | 1 | 1,12 GiB | 0 | auf Anfrage | auf Anfrage | auf Anfrage | auf Anfrage |
lrz.small | 1 | 4,5 GiB | 0 | auf Anfrage | auf Anfrage | auf Anfrage | auf Anfrage |
lrz.medium | 2 | 9 GiB | 0 | auf Anfrage | auf Anfrage | auf Anfrage | auf Anfrage |
lrz.large | 4 | 18 GiB | 0 | auf Anfrage | auf Anfrage | auf Anfrage | auf Anfrage |
lrz.xlarge | 10 | 45 GiB | 0 | auf Anfrage | auf Anfrage | auf Anfrage | auf Anfrage |
lrz.2xlarge | 20 | 90 GiB | 0 | auf Anfrage | auf Anfrage | auf Anfrage | auf Anfrage |
lrz.4xlarge | 40 | 180 GiB | 0 | auf Anfrage | auf Anfrage | auf Anfrage | auf Anfrage |
nvidia-v100.1 | 20 | 368 GiB | 1 | auf Anfrage | auf Anfrage | auf Anfrage | auf Anfrage |
Es werden lediglich Kosten für virtuelle Maschinen in Rechnung gestellt, denen Ressourcen zugewiesen sind. Wird eine VM ausgeschaltet ("geshelved"), fallen für diese keine Kosten an.
Um die Kosten beschränken zu können, die maximal anfallen können, gibt es zwei Arten von Budgets, die vom Master User verwaltet werden:
1. Projektbudget: Das Projektbudget legt die Obergrenze für die Kosten fest, die vom Projekt insgesamt erzeugt werden können. Die Gesamtkosten setzen sich aus den Kosten zusammen, die von den einzelnen Benutzern des Projekts erzeugt werden.
2. Benutzerbudget: Das Benutzerbudget bietet die Möglichkeit, die Kosten einzuschränken, die ein einzelner User erzeugen kann.
Sobald ein Budget überschritten wird, werden die betreffenden VMs ausgeschaltet (geshelved). Bei Überschreiten des Projektbudgets werden alle VMs des Projekts geshelved, bei Überschreiten eines Benutzerbudgets werden alle VMs des entsprechenden Benutzers geshelved.
VMs können erst dann wieder gestartet werden (d.h. auf deren Daten kann erst dann wieder zugegriffen werden), wenn das Budget erhöht wurde.
Das LRZ behält sich das Recht vor, VMs und Daten zu löschen, falls Budgets seit mehr als drei Monaten überschritten sind. Nutzer sind selbst dafür verantwortlich, Daten rechtzeitig zu sichern
Leibniz-Rechenzentrum
der Bayerischen Akademie der Wissenschaften
Boltzmannstraße 1
85748 Garching