Aus dem Kurs: Cloud Computing-Strategie: Nachhaltigkeit

Datenhaltung optimieren

Aus dem Kurs: Cloud Computing-Strategie: Nachhaltigkeit

Datenhaltung optimieren

Datenhaltung optimieren. Ein wichtiger Schritt zu einer nachhaltigen Cloud-Strategie ist die Planung der Datenhaltung. Und zwar geht es hierbei um die Optimierung der Datenhaltung, Datenarchivierung und vor allem auch der Datenlokalisierung. Wichtig ist es zum Beispiel, Daten nah an der Anwendung zu halten, um unnötigen Traffic zu vermeiden. Datentransfers zwischen Rechenzentren oder zwischen Kunde und Rechenzentrum verursachen heute sehr hohe Energieverbräuche und damit natürlich auch Kosten. Man kann also beispielsweise überlegen, Applikationen und Systeme dahingehend zu optimieren, dass man Daten vor der Übertragung filtert. Also wirklich auch hier wieder nur so viel wie nötig und so wenig wie möglich an Daten übermittelt. Und trotz der Unendlichkeit der Cloud sollte man sich damit befassen, Daten regelmäßig zu archivieren oder gegebenenfalls eben auch zu löschen. Die Massenspeicherung, die Auswertung auf zu viele Daten oder der Zugriff auf unnötige Daten sollte vermieden werden. Denn hier erzeugen wir nur einen personellen und auch ökonomischen Overhead, den es nicht zu bestreiten gilt. Wichtig ist es, niemals Anwendungen ohne ihre Daten zu verschieben, besonders bei der Migration. Denn hier passiert folgendes: Wir verschieben eine Anwendung in die Cloud, heben uns aber den Datenbestand zum Beispiel im eigenen Rechenzentrum auf, was zwangsläufig dazu führen wird, dass wir sehr hohe Datentransfers zwischen den zwei Infrastrukturen haben, die aus Nachhaltigkeitssicht natürlich nicht optimal sind. Außerdem müsste man bei der Planung der Datenhaltung auch Datenflüsse bedenken. Das heißt, obwohl ich vielleicht eine Applikation in die Cloud migriere, auch mit ihrem gesamten Datenbestand, könnte es ja zum Beispiel sein, dass aus der Anwendung heraus unheimlich viel gedruckt wird, zum Beispiel über Plotter oder ähnliches. Und diese stehen nun mal in meiner On-Premises-Infrastruktur. Auch das kann also ein Aspekt dabei sein zu entscheiden, welche Systeme schafft man in die Cloud und welche nicht? Grundsätzlich wichtig: Duplizierung von Daten vermeiden. Die AI ist Fluch und Segen zugleich. Wir haben auf der einen Seite große Datenmengen und diese sind auch notwendig für Training und das Anlernen von Machine-Learning-Algorithmen. Und auf der anderen Seite haben wir den Vorteil, dass bereits trainierte Modelle mit minimalen Daten schon Entscheidungen treffen können. Wichtig ist hier aber eben, die doppelte Datenhaltung und die Duplizierung von Daten so weit wie möglich zu minimieren. Fazit: Die Datenhaltung ist eine wichtige Cloud-strategische Entscheidung und sollte von vornherein betrachtet werden.

Inhalt