Datenkonvertierung – Nicht nur für IT-Archäologen

Wer Daten speichert, darf nicht nur kurzfristig denken. Mittel- und langfristige Datensicherung wird entscheidend und zugleich schwieriger. Technologien wechseln sich immer schneller ab. Die Produktion von Maschinen und Flugzeugen in den 1980er Jahren steuerten zum Beispiel Programme, die genauso wie die dazugehörige Hardware heute Technikgeschichte sind. Die Überspielung dieser Daten auf aktuelle Medien kann aber bei einem plötzlichen Gewährleistungsanspruch oder bei der Wiederaufnahme der Produktion schnell nötig werden. Compliance-Vorschriften, aber auch Regressansprüche aus der „analogen“ Rechtswelt zwingen Unternehmen dazu, Daten langfristig vorzuhalten oder auf Anfrage – etwa bei Gerichtsverfahren – schnell und gerichtsverwertbar bereitzustellen. Nur wer Daten verfügbar hält, ist also auf der sicheren Seite. Zumal Geschäftsführung und IT-Leiter unter Umständen auch persönlich für Schäden haften, wenn Daten nicht verfügbar sind.

Dreifacher Nutzen

So muss sich jeder Administrator der Aufgabe stellen, seine Speicherlandschaft zu vereinheitlichen und zu aktualisieren. Eine solche Konvertierung erhöht zum Ersten die Effizienz des Rechenzentrums. Experten von Kroll Ontrack sicherten 15.000 Bänder aus unterschiedlichen Archiv-Systemen proprietärer Backups auf ein firmenübergreifendes Backup-System mit LTO4-Laufwerken. Durch die Homogenisierung von Daten verschiedenster Herkunft – durch eine professionelle Konvertierung - laufen in Zukunft Sicherungsprozesse einfacher, sicherer und automatisch ab. Zudem ist dann nach der Vereinheitlichung nur noch eine Speicherumgebung zu warten. Eine nach erfolgter Katalogisierung durchgeführte Deduplizierung der Datenbestände senkt zudem die Kosten für Hardware und Strom.

Zum Zweiten hilft die Datenkonvertierung, die zunehmenden Compliance-Anforderungen besser zu bedienen. Bei einer einheitlichen Speicherlandschaft können Anfragen von Wirtschaftsprüfern oder Anwälten schnell beantwortet werden und alle Informationen sind wirklich schnell abrufbar. Die Anforderungen des Kunden sind dabei entscheidend. Bei einer Anfrage einer Unternehmensberatung konnten sogar nicht nur Dokumente, sondern auch komplette Serverkonfigurationen mit allen ACL (Access Control List)-Rechten exakt nachgebaut werden.

Im Vorfeld einer Datenkonvertierung wird oft auch eine Datenrettung nötig. So kommen zum Dritten verloren geglaubte Daten wieder zum Vorschein. In einem Fall wurden 5.200 Bänder eines Pharmaunternehmens nach einem Wasserschaden getrocknet, erfasst und überspielt. Eine Datenwiederherstellung ist auch in punktuellen Fällen möglich. Etwa wenn es um selbst programmierte Forschungsanwendungen geht, die sich auf einem Tape finden, dessen Hersteller schon lange nicht mehr am Markt ist.

Zwei Schauplätze

Datenkonvertierung hat zwei Schauplätze. Zum einen die Medienkonvertierung. Hier geht es um die Übertragung von Daten auf aktuelle Datenträger. Der ständigen Wechsel von Formaten und Backupverfahren sorgt hier für Probleme. Technologien haben sich verändert, Hersteller sind vom Markt verschwunden. Selbst innerhalb einzelner Aufzeichnungsverfahren finden sich unterschiedliche Varianten. So ist DLT nicht gleich DLT. Wikipedia listet aktuell 18 Varianten auf – unterschiedlich in Bauform, Spurenaufbau, Datendichte oder Verschlüsselung. Alle Daten müssen daher auf ein Standard-Tape überspielt werden. In einer einheitlichen und aktuellen Speicherlandschaft lassen sich Daten einfacher sichern und später schnell weiter auf aktuellere Träger migrieren.

Zum anderen sind Daten aus den verschiedensten Umgebungen weiter zu verarbeiten. Im Mainframe-Bereich gibt es schon bei IBM verschiedene Formate. UNIX bringt mit TAR, cpio und Dump schon drei Grundformate. Nicht selten müssen Mainframe- oder Midrange-Dateien nun für Server und PC verfügbar sein. Ein weiteres Problem ist die unterschiedliche Codierung der digitalen Inhalte. IBM- Großrechner kodieren teilweise mit EBCDIC statt mit ASCII-Code. Ebenso müssen häufig Inhalte zwischen Datenbanksystemen migriert werden, wie von älteren Datenbankformaten hin zu ACCESS oder SQL. E-Mail-Daten werden direkt aus dem Tape-Backup extrahiert.

Projektarbeit

IT-Archäologen haben kein Patentrezept. Jede „Ausgrabung“ ist ein eigenes Projekt und erfordert von Anfang an eine umfassende Analyse. Wie groß ist der Umfang des Projekts, welche technischen wie personellen Ressourcen sind nötig? Dürfen Daten zur Bearbeitung das Unternehmen verlassen oder nicht? Nach der Projektanalyse erfolgt die Katalogisierung und Spezifikation der Daten. Wenn undokumentiert Bänder in Kellern lagern, wird das schnell zu einem Puzzlespiel. Experten können aber auch ungenügend beschriftete Tapes zusammenfinden, die im Tape-Set-Verfahren über mehrere Tapes beschrieben wurden. Im nächsten Schritt erfolgt dann eine Deduplizierung der Daten. Was einmal katalogisiert wurde, lässt sich schnell auf Doppler untersuchen und der Speicherbedarf sinkt spürbar. Konsolidierte Datenlandschaften können entweder auf neue Medien konvertiert oder auch weiterverarbeitet werden.

Keine Ausreden mehr

Datenkonvertierung ist Pflicht. Sie fordert Expertenwissen und Expertenberatung. Denn die Halbwertszeit der Geschäftsinformationen läuft ab. Auch im Bereich Tapes, wo vor allem Daten mittel- und langfristig gesichert werden. Langfristige Datensicherheit ist nötig und erfordert eine grundsätzliche Strategie und Aufwand, bringt aber auch einen erheblichen Nutzen. Der Mut zur Datenlücke lässt sich durch Nichts mehr rechtfertigen.

Holger Engelland, Manager Data Recovery Engineering, Kroll Ontrack GmbH