Samstag, 28. Januar 2017

Datensicherung in der Wolke

Im Jahr 48 vor unserer Zeitrechnung ist angeblich in Alexandria die größte Bibliothek ihrer Zeit abgebrannt. Tausende Dokumente wurden unwiederbringlich zerstört. Dabei ist unerheblich, ob sie wirklich durch ein Feuer zerstört wurden, Tatsache ist jedenfalls, dass sie verloren gingen.

So wie zigtausende andere Dokumente in den Jahrhunderten danach: Brände in Kirchen, Museen, Klöstern, Burgen und Schlössern sowie Privatgebäuden haben unermessliche Schätze hinweg gerafft. Dokumente gehen aber auch durch Hochwasser, Einstürze (Kölner Stadtarchiv 2009!), Vandalismus, Diebstahl etc. verloren - bis heute.

Im Zeitalter der Computer müsste oder könnte damit aber Schluss sein. In den letzten Jahren ist so viel Speicherplatz in der globalen Datenwolke (Cloud) zu einem vernünftigen Preis verfügbar geworden, dass die Speicherung von privaten Dokumenten und vor allem Fotos in der Cloud selbst für Otto Normalverbraucher attraktiv geworden ist.

Nur zur Veranschaulichung der Größenordnungen, von denen hier die Rede ist: Google installiert (Stand Anfang 2016) ein PetaByte Speicherplatz (das sind grob gerechnet 1.000 TeraByte oder 1.000.000 GigaByte) - täglich, Tendenz steigend! Und das ist nur Google; die anderen großen Mitspieler wie amazon, Microsoft, apple, Oracle etc. werden wohl in ähnlichen Dimensionen aufstocken.


Quelle: pixabay


Speicherung in der Cloud ist gut und schön - einerseits. Andererseits muss aber klar sein, dass die Dokumente, sobald sie in der Cloud landen, auch gewissen Angriffen ausgesetzt sind. Das müssen nicht unbedingt Hacker oder die NSA sein; selbst einem Administrator bei einem der Cloud-Anbieter möchte man nicht unbedingt Einsicht in allerpersönlichste Dokumente geben. Der muss gar nicht hacken, der sitzt quasi an der Quelle, und hat theoretisch Einsicht in Dateien, die ihn gar nichts angehen.

Wirksame Abhilfe schafft hier nur starke Verschlüsselung - und zwar bevor die Dateien in die Cloud hochgeladen werden! Wenn dann der oben erwähnte Administrator doch so eine verschlüsselte Datei öffnet, sieht er nur Datenschrott!
Manche Provider bieten an, die Daten von sich aus zu verschlüsseln; dann ist das aber deren Schlüssel und nicht meiner... Das ist nur eine Scheinsicherheit und nicht sonderlich Vertrauen erweckend.

Ich habe mir vor einiger Zeit ein Verfahren eingerichtet, mit dem ich meine Dateien, die mir persönlich wichtig sind (Dokumente, Fotos, Briefe, Tabellen etc.), verschlüsselt in die Cloud kopieren kann. Die Einrichtung ist relativ einfach und großteils automatisierbar, sodass man sich um die Datensicherung nicht mehr groß kümmern muss.

Die folgende Grafik zeigt das Verfahren grob im Überblick:

Klicke auf das Bild, um es zu vergrößern
Die kleinen Fotos in den Kästchen veranschaulichen, ob eine Datei im Klartext oder verschlüsselt vorliegt.

Ich werde im Folgenden die einzelnen Komponenten näher beschreiben. Es kann dabei mitunter etwas technisch werden, ich hoffe aber, nicht allzu sehr.



Motivation für dieses Verfahren war die Wiederherstellung unserer Daten im Katastrophenfall - also wie erwähnt Brand, Hochwasser (vielleicht nicht sonderlich realistisch) oder Diebstahl (durchaus realistisch).

Datensicherung auf eine externe Festplatte ist zwar ein guter Anfang, wenn aber der Kellerraum, in dem mein Rechner steht, zerstört oder ausgeräumt wird, wird damit auch die externe Sicherung zerstört. Die Dateien sind dann wirklich endgültig und unwiederbringlich futsch!

Worum es mir dabei nicht so sehr geht: um eine Langfrist-Archivierung. Falls die gängigen Datei-Formate wie jpg, png, pdf, doc, xls etc. einmal nicht mehr zur Verfügung stehen sollten, muss ich mir sowieso eine Umwandlung in ein dann neues Format überlegen. Das ist dann aber eine andere Geschichte.

Die wesentlichen Komponenten dieses Verfahrens sind:
  • Das Verzeichnis D:\_daten
  • Die Software mirror
  • Die Software Boxcryptor
  • Das Verzeichnis H:\GoogleDrive
  • Die Software GoogleDrive
  • und die Google Cloud (Google Drive)

Das Verzeichnis D:\_daten

Dieses Verzeichnis gibt es auf allen Rechnern, die ich für mich, Freunde und Verwandte einrichte. Sämtliche Dateien, die gesichert werden sollen, landen darin. Damit ist einmal eine strikte Trennung von Programmen und Daten gewährleistet, die eine einfache Datensicherung überhaupt erst möglich macht. Bei mir sind das eben vor allem Fotos aber eben auch alle anderen Dokumente, die ich nicht verlieren möchte.

Die Software mirror

mirror.exe sorgt dafür, dass alle neuen oder geänderten Dateien in ein anderes Verzeichnis kopiert werden. Es sorgt aber auch dafür, dass sich auch das Löschen von Quell-Dateien im Ziel-Verzeichnis niederschlägt. Das Ziel-Verzeichnis ist also ein Spiegelbild des Quell-Verzeichnisses - daher der Name mirror.

Ich habe mirror so eingerichtet, dass es sämtliche Daten aus D:\_daten nimmt und in das Boxcryptor-Verzeichnis kopiert (s. unten). Dieses Kopieren stoße ich manuell an; das ist der einzige Schritt in dem ganzen Verfahren, der nicht vollautomatisch abläuft, sondern der von mir manuell gestartet wird (etwa 1-2 Mal die Woche). Dieser Anstoß beschränkt sich auf das Starten einer bat-Datei, die das entsprechende mirror-Kommando mit den passenden Parametern enthält:

mirror d:\_daten z:\

D:\_daten ist bei mir ca. 80GB groß; mirror braucht für das Durchkämmen des ganzen Verzeichnisbaums ca. 25 Minuten.

Die Software Boxcryptor

Boxcryptor ist ein Stück Software, das auf dem PC ein virtuelles Laufwerk (bei mir Z:\) installiert. Das ist also ein Laufwerk, das es real gar nicht gibt, sich aber aus Sicht von Windows wie ein solches benimmt. Damit die Daten dann doch irgendwo gespeichert werden können, muss man BoxCryptor bei der Einrichtung mitteilen, wo es die Daten ablegen darf. Bei mir ist das das Verzeichnis H:\GoogleDrive\encrypted. Man braucht also für die Kopie der Daten noch einmal soviel Plattenplatz wie für die Originaldaten; ist aber heutzutage keine preisliche Herausforderung mehr!

Der Clou an der Sache ist aber, dass bei der Einrichtung von Boxcryptor ein Schlüssel vergeben wird, der sämtliche Dateien, die nach Z: kopiert werden mit diesem Schlüssel eben verschlüsselt werden. Dieser Schlüssel muss aber dementsprechend lange und kompliziert sein, sodass er auch einem Kryptangriff Stand hält. Die Klassiker "1234" oder "qwertz" scheiden damit aus, es sollte schon sowas in der Art wie "iuo#MaXy%^mF8MHVCTQz" oder ähnlich sein!

Wichtiger Hinweis: Dieser Schlüssel darf auf keinen Fall verloren gehen! Am besten irgendwo aufschreiben, zum Beispiel in KeePass. Zu KeePass hab ich schon vor einiger Zeit einmal was geschrieben, da möchte ich an dieser Stelle nur darauf verweisen. Zur Not tut's auch ein Zettel, der irgendwo sicher verwahrt ist. Ein PostIt, auf den Bildschirm geklebt, sollte es halt auch nicht sein...

Sollte nämlich wirklich der Fall der Fälle eintreten und man muss einen neuen PC einrichten, muss natürlich auch Boxcryptor wieder neu auf diesem Rechner installiert werden. Wenn man dann den korrekten Schlüssel nicht parat hat, ist die ganze schöne Sicherung in der Cloud nur noch unbrauchbarer Datenschrott! Eine Rekonstruktion der Daten ist dann deshalb nicht mehr möglich, weil die Entschlüsselung der Dateien nicht mehr möglich ist!

Das Schöne an Boxcryptor ist, dass es diese Software für sämtliche gängigen Plattformen gibt, also für Windows aber auch für Mac, android und iPhone! Boxcryptor ist übrigens nicht das einzige Tool, das so arbeitet, es gäbe da zum Beispiel auch noch Cryptomator.

Boxcryptor wird bei jeder Anmeldung in Windows automatisch gestartet und wartet dann im Hintergrund darauf, dass jemand Dateien in das Laufwerk Z: kopiert, die es dann verschlüsseln und so in H:\GoogleDrive\encrypted ablegen darf.

Google Drive

Das Verzeichnis "H:\GoogleDrive", das Programm "GoogleDrive" und die Cloud namens "Google Drive" bilden zusammen eine Einheit.

Das Verzeichnis H:\GoogleDrive ist das Spiegelbild meiner Daten in der Cloud Google Drive. Da ich außer den Daten, die ich von meinem PC auf Google Drive sichere, noch andere in der Cloud halte, gibt es für das Sicherungsverfahren ein eigenes Unterverzeichnis names H:\GoogleDrive\encrypted. H:\GoogleDrive selbst und Unterverzeichnisse (außer eben encrypted) sind nicht verschlüsselt. Da kommen aber auch keine vertraulichen Daten hinein!

H:\GoogleDrive ist also jenes Verzeichnis, das das Programm GoogleDrive beobachtet. Sollte es darin Veränderungen geben, werden sie sofort mit der Cloud Google Drive abgeglichen.

Das Programm GoogleDrive wird so wie Boxcryptor bei jeder Anmeldung in Windows automatisch gestartet.

Ich habe den Eindruck, dass GoogleDrive vielleicht nicht so bekannt ist wie Dropbox. Es funktioniert aber ganz analog. Auch bei der der Dropbox wird ein Verzeichnis auf dem PC definiert, das mit der Dropbox-Wolke durch das Programm Dropbox ständig abgeglichen wird. Dropbox hat übrigens keinen eigenen Speicher, sondern verwendet die amazon-Cloud!


Der Ablauf

Gratulation an alle, die bis hierher durchgehalten haben!

Es hat sich gelohnt, denn schön langsam kristallisiert sich ein Ablauf heraus:
  • Bei Anmeldung oder Neustart von Windows werden Boxcryptor und GoogleDrive automatisch gestartet. Boxcryptor erzeugt ein virtuelles Laufwerk Z: und legt Dateien, die dorthin kopiert werden, in Wirklichkeit auf H:\GoogleDrive\encrypted ab - verschlüsselt.
  • Etwa ein- bis zweimal pro Woche stoße ich die bat-Datei an, die per mirror.exe ein Kopieren (genauer: Spiegelung) von D:\_daten auf Z:\ veranlasst. Dieser Durchgang durch Z:\ bewirkt, dass die Dateien dabei per Boxcryptor verschlüsselt werden.
  • Alles Weitere läuft wieder automatisch: sobald dieser Spiegelungsvorgang Veränderungen im Zielverzeichnis verursacht, sorgt das Programm GoogleDrive dafür, dass jenes mit der Cloud abgeglichen wird. Dabei werden nur verschlüsselte Dateien hochgeladen, andere gibt es ja gleich gar nicht.
Fertig, das war's! 
Alle Daten aus D:\_daten sind in der Cloud verschlüsselt abgelegt!

Kosten und Sicherheit

Bei jedem Google-Konto sind 15GB Speicher in GoogleDrive gratis dabei. Google ist dabei recht großzügig: nur Fotos, die größer als 2000 pixel sind, gehen dabei auf das Kontingent, alle kleineren werden nicht gezählt.

Trotzdem sind 15GB relativ rasch verbraucht. Ich habe daher bei Google zusätzlichen Cloud-Speicher gemietet. Dabei kosten 100GB $2,40 inkl. Steuern pro Monat; umgerechnet je nach Kurs etwa EUR 2,40 - jedenfalls unter EUR 30,-- pro Jahr. Von diesen 100GB sind derzeit 80GB belegt, es ist also noch ein wenig Platz für weitere Fotos!


Das Konzept einer Speicherwolke (Cloud) hat es an sich, dass man sich um die Sicherung der Daten innerhalb der Cloud nicht kümmern muss, das machen die Betreiber schon selbst. Diese Daten werden global verfügbar gehalten und sind auf zig Rechnern und Rechenzentren weltweit gelagert. Es ist also unvorstellbar, dass sämtliche Instanzen einer Datei verloren gehen. Da müsste schon die Erde als Ganzes in die Luft fliegen. Wenn ich also nicht selbst ihre Löschung veranlasse, kann ich davon ausgehen, dass eine Datei einfach immer zur Verfügung steht - und das weltweit!

* * * * * * *

In der Einleitung war die Rede von der Bibliothek in Alexandria. Ich möchte diesen Post mit der Österreichischen Nationalbibliothek (ÖNB) beschließen.

Seit 2011 läuft dort ein Projekt gemeinsam mit Google, bei dem ca. 600.000 Bücher von Google digitalisiert werden - kostenlos für die ÖNB. Diese eingescannten Bücher stehen dann öffentlich zur Verfügung, sind leicht durchsuchbar, leiden nicht durch die Ausleihe und vor allem: sie bzw. deren Inhalt können nicht mehr verloren gehen! Mit Ende 2016 sind bereits mehr als 400.000 Bücher eingescannt und sind online einsehbar; etwa 200.000 davon stammen allein vom Prunksaal der Bibliothek!



Keine Kommentare:

Kommentar veröffentlichen