Datensicherung stammt aus den Anfängen der Business-IT. Magnetplatten waren mit wenigen Tausend Stunden MTBF (Mean Time before Failure) ein sehr instabiles Storage-Medium. Deshalb hatte die allnächtliche Datensicherung auf diverse Bänder oberste Priorität, um sich gegen das damals größtmögliche Desaster, den Platten-Crash, abzusichern. Heute sind die Magnetplatten zwar um den Faktor 1000 zuverlässiger, aber die Anforderungen in puncto Business Continuity sind noch stärker angestiegen. Inzwischen können sich viele Unternehmen den Ausfall der IT nur noch für eine extrem kurze Zeit leisten. Ein Plattenausfall ist auch nicht mehr der Super-GAU in einem Rechenzentrum. Heute gibt es weitaus schlimmere Unterbrechungsgefahren wie Hacker, versehentliches Löschen, Stromausfall oder sogar physische Beeinträchtigungen. Entsprechend hoch sind die Anforderungen an Backup und Recovery. Moderne Storage-Systeme und -Programme bieten hierzu zahlreiche Lösungen. Doch ein Problem, das genauso alt ist wie das Thema Backup, können auch sie nicht lösen: Die zu sichernden Datenmengen steigen exponentiell an.
Zwei neue bahnbrechende Technologien zeigen den Weg zu einem Paradigmenwechsel in der Welt der Datenspeicherung: Daten-Deduplizierung und der Einsatz von NAND-Flash-Technologie. Daten-Deduplizierung bedeutet wesentlich weniger Datenverarbeitung trotz steigenden Datenvolumens und der Einsatz von Flash macht die Massenspeicher schneller und vor allem zuverlässiger.
So sind die Vorteile von Flash-Memory überwältigend: 30-fache Anzahl an I/O-Operationen pro Sekunde, zehnmal schnellere Antwortzeit und 98 Prozent Stromeinsparung. Der einzige Nachteil ist der hohe Preis. Doch der wird schon in wenigen Jahren auf das Niveau der Highend-Magnetlaufwerke abgesunken sein. „Die Flash-Preise fallen derzeit wesentlich schneller, als wir es vermutet haben, vielleicht geht die Entwicklung noch weitaus rasanter voran, als wir es im Moment sehen", vermutet Joe Tucci, EMCs Chairman, Präsident und CEO.
Als Folge dieses Preisverfalls werden Flashbasierte Solid-State-Drives (SSD) schon bald die Tier-1-Magnetlaufwerke ablösen. „Es verschiebt sich alles um eine Stufe: Bänder sterben aus, Festplatten werden die neuen Bänder und Flash die neuen Festplatten", prophezeit bereits Pund-IT-Analyst Charles King. Mit dem Einzug von Flash in die RZ-Speicherwelt lassen sich vor allem die in letzter Zeit immer kritischer gewordenen Probleme mit den Zugriffszeiten und dem Stromverbrauch lösen - doch Flash ist keine Antwort auf die anstehende Datenexplosion. So wird laut IDC die gesamte digital gespeicherte Datenmenge bis 2011 auf 1.773 Milliarden Gigabytes ansteigen.
Hierzu soll eine weitere Neuerung der Speichertechnologie Abhilfe schaffen: Die Daten-Deduplizierung. Knapp gesagt, bedeutet Deduplizierung nichts anderes, als dass nach unterschiedlichen Algorithmen nur Teile der Originaldaten abgespeichert werden. Am besten lässt sich Deduplizierung mit der JPEG- oder ZIP-Kompression vergleichen: Wenn sich Datenblöcke innerhalb einer Datei oder auch in verschiedenen Dateien wiederholen, werden die Stellen mit einem Platzhalter markiert und der Datenblock wird nur einmal gespeichert. Daraus lassen sich dann später die Originalversionen wieder reproduzieren. Andere Verfahren speichern lediglich die abgeänderten Teile einer Datei oder filtern Kopien heraus, die dann als Verweis auf die Originaldatei abgelegt werden. Haben beispielsweise zehn E-Mails alle dieselbe Anlage, so wird diese nur einmal archiviert. Anwender berichten von Volumeneinsparungen von 20:1 oder mehr.
Generell unterscheidet man den Einsatz von zwei getrennten Deduplizierungsverfahren: Inline und Post-Processing. Beim Inline-Verfahren werden die Daten bereits im LAN komprimiert. Das bedeutet zwar weniger Daten im Netz, dafür aber mehr Overhead, was bei einer Reihe von Anwendungen inakzeptabel ist.
Demgegenüber werden beim Post-Processing die Daten erst beim Ablegen komprimiert, was nicht nur weniger Overhead bedeutet, sondern darüber hinaus auch eine regelbasierte automatische Durchführung erlaubt. Und das ist ein wichtiger Schritt in Richtung eines automatischen Rechenzentrum-Betriebs. Richard Napolitano, EMCs Senior Vice President und General Manager für Multiprotokoll-Produkte, meint, dass man Deduplizierung nur auf solche Datenbestände anwenden sollte, die zur Archivierung bestimmt sind. „Solange die Dateien noch ständig abgerufen und geändert werden müssen, macht Deduplizierung wenig Sinn", lautet sein Rat.
Diese direkten Vorteile von SSD und Deduplizierung nehmen sich aber bescheiden aus im Verhältnis zu den Anwendungskonsequenzen, die sich daraus ergeben. Beispielsweise gehen alle heutigen Backup-Programme davon aus, dass als Massenspeicher eine Magnetplatte eingesetzt wird, die relativ langsam ist und auch nur eine begrenzte Lebensdauer hat. SSDs mit RAID-1 bedeuten aber praktisch keine Performance-Einschränkungen und auch keine Datenverluste durch Verschleiß mehr. Folglich muss kein systembedingter Backup durchgeführt werden, sondern nur noch die Archivierung und Protokollierung, die den Compliance- und Accounting-Vorgaben entspricht. „Backup und Archivierung verschmelzen zu einem Prozess; es wird dafür bald keine getrennten Programme mehr geben", meint deshalb Mike Karp, Senior Analyst bei der Enterprise Management Association (EMA).
Und auch der Einsatz von Deduplizierung wird weitgehende Änderungen bewirken. Zwar ist für die zeitkritischen Anwendungen ein Inline-Verfahren zu langsam, aber es gibt viele Bereiche, wo dieses Argument keine Rolle spielt - beispielsweise bei der Archivierung und dem Backup von Filialen und Remote-Büros. „Mit Deduplizierung ist sogar ein kontinuierlicher Backup von Remote-Einrichtungen in greifbare Nähe gerückt - eine noch vor wenigen Jahren unvorstellbare Vorgehensweise", sagt Bob Laliberte, Analyst bei der Enterprise Strategy Group.
Damit ermöglichen Deduplizierung, Flash-Speicher und die neuen Storage-Management-Programme nicht nur ein kontinuierlich schnelles Backup, sondern vor allem auch ein wesentlich schnelleres Wiederanlaufen nach einem Systemausfall - und das trotz steigender Datenmenge und größeren Performance-Anforderungen.
Weitere Informationen
Weitere Informationen
