Filesystem/RAID/Verschlüsselung

  • Gibt's da mittlerweile was brauchbares? Verlangt ist nur hohe Sicherheit vor sterbenden Platten und Verschlüsselung.

    Momentan verwende ich Standard-SW-RAID 1 bzw. 5 mit LUKS und ext4.

    SW-RAID prinzipiell geht eh halbwegs. Leider sind dann die Daten auf einer Platte korrupt und nicht mehr wirklich wiederherstellbar (ja, hab' eh Backups, aber will das nicht gleich ausreizen). Bei RAID6 könnte ich theoretisch die Daten wiederherstellen - geht das in der Praxis brauchbar? Also - mir ist schon klar, wenn eine Platte ausfällt, kann ich die aus dem RAID kicken und auf der "guten" sind die Daten ok. Ich hatte grad wieder so eine lustige Platte, die Wochen mitlief, ich hab' nicht ganz genau in dmesg geschaut und jetzt hat sich einiges an Müll angesammelt. Wenn da jetzt zwei Platten spinnen...

    Ich suche eigentlich eher eine Lösung mit Prüfsummen im Dateisystem, ähnlich wie bei zfs bzw. btrfs. Am liebsten hätte ich es, wenn die Daten bei jeder Lese- oder Schreiboperation geprüft werden - also nicht zum Optimieren bei einem RAID1 etwa abwechselnd von den Platten gelesen wird sondern ich mag höchstmögliche Datenintegrität. Zusätzlich regelmäßige Überprüfungen des gesamten Datenbestandes - also Dateien gegen Prüfsummen.

    zfs und btrfs haben den Nachteil, dass RAID/Filesystem auf einer Ebene sind und ich somit mit LUKS nicht mehr dazwischenkomme.

    Wie macht ihr das so? Mein bester Ansatz ist händisch die Prüfsummen zu den Files zu verwalten und abzugleichen... bzw. Prüfsummen von aktuellen Files mit Backup vergleichen (betreffend der Dateien, die eher gelagert werden und nicht verändert).

  • höchstmögliche Datenintegrität.

    ich betreibe seit kurzem ein 6x2TB ZFS RAID-Z2 setup mit ECC RAM. das ergibt etwa 8TB nutzspeicher bei 2 parity platten (also aehnlich wie RAID6). ein kleineres RAID-Z level macht bei 12TB auch nicht sinn, da die wahrscheinlichkeit fuer einen kompletten datenverlust zu hoch ist. ZFS sorgt hierbei fuer die datenintegritaet auf den platten (self-healing) und der ECC RAM fuer die integritaet der gecachten, noch nicht geschriebenen, daten. das ganze laeuft auf FreeNAS 8, welches atm ZFSv15 (iirc) unterstuetzt.


    zfs und btrfs haben den Nachteil, dass RAID/Filesystem auf einer Ebene sind und ich somit mit LUKS nicht mehr dazwischenkomme.


    da encryption fuer meine anwendung keine rolle spielt kann ich leider nicht viel dazu sagen. ausser, dass ZFS ein encryptionsystem ueber der I/O pipeline fuer implementationen ab v30 spezifiziert.
    das ist jedenfalls noch zukunftsmusik fuer FreeNAS...

  • Sehr fein, wusste nicht, dass Encryption wirklich schon implementiert ist, danke für den Tipp. Dann werde ich mir das self-healing nochmal ansehen (hab' auf die schnelle nichts gefunden, wann das durchgeführt wird - nur bei Zugriff oder regelmäßig über den kompletten Bestand - ich hab' viel Zeug rumliegen, was evtl. Jahre nicht angegriffen wird, wobei ein touch-Script noch immer einfacher wäre als mit Prüfsummen rumtun).


  • Momentan verwende ich Standard-SW-RAID 1 bzw. 5 mit LUKS und ext4.

    genau so mach ichs auch.


    Am liebsten hätte ich es, wenn die Daten bei jeder Lese- oder Schreiboperation geprüft werden - also nicht zum Optimieren bei einem RAID1 etwa abwechselnd von den Platten gelesen wird sondern ich mag höchstmögliche Datenintegrität.

    witzig, genau sowas hab ich mit FUSE implementiert ;) war ne nette publikation (Improved Redundancy and Consistency beyond RAID1), produktiv einsetzen wuerde ich es nicht, hehe.

    Zitat von gelbasack


    Dann werde ich mir das self-healing nochmal ansehen (hab' auf die schnelle nichts gefunden, wann das durchgeführt wird - nur bei Zugriff oder regelmäßig über den kompletten Bestand - ich hab' viel Zeug rumliegen, was evtl. Jahre nicht angegriffen wird, wobei ein touch-Script noch immer einfacher wäre als mit Prüfsummen rumtun).

    wozu willst du touchen? vernuenftige FSs haben auto-scrubbing.

    Willfähriges Mitglied des Fefe-Zeitbinder-Botnets und der Open Source Tea Party.

    Einmal editiert, zuletzt von Kampi (11. August 2011 um 10:32)

  • ich verwende ebenfalls software RAID5. wenn du dich bei einem plattenausfall einfach nur benachrichtigen lässt, reicht das für den privatgebrauch nicht aus?
    hab mir irgendwann mal die MTTF mit einer MTTR von 1 woche ausgerechnet und die war dann schon ziemlich hoch. wennst das noch mit einem backup kombinierst bist ja gut dabei?

    ich hab alles auf einer SSD laufen, synce die mit dem RAID und kopiere das wichtigste gelegentlich auf den laptop. lediglich ein RAM defekt macht mir sorgen...ich nehm mal an ein ext3 ist dagegen nicht geschützt?

    lg,
    oliver

  • Nein, reicht mir nicht. Ich rechne die MTTF ja nicht für einen Totalausfall (im Fall von RAID 5 >= 2 Platten), sondern für Datenverlust. Und der kann schon auftreten, wenn nur eine Platte ein wenig Probleme macht. Ich hatte das leider schon öfters mit unterschiedlichen Platten...

    Genauer läuft es folgendermaßen ab: Ich will Daten kopieren. Eine Platte hat Probleme, klackt, im dmesg kommt dann ein Eintrag von wegen "resetting link". Sitzt man dabei fällt auch eine kurze Verzögerung auf. Kopiert werden die Daten aber, es kommt keine Fehlermeldung, das RAID wird als konsistent angezeigt. In dem Fall reicht es, wenn eine Platte Probleme macht. Kann auch ein schlechter Kontakt beim SATA-Kabel sein, eine "Laune", was weiß ich. Hatte das auf jeden Fall schon öfters. Prozentuell geht dabei nicht so viel verloren - aber es soll gar nichts verloren gehen.

    Daher der Wunsch nach ZFS. Wenn was inkonsistent ist, soll das ganze über Prüfsummen repariert werden. Anders kann gar nicht festgestellt werden, welche Platte die kaputten Daten hat.

    RAM-Defekt ist ja ein ähnliches Problem. Die Daten zwar gespiegelt, aber wenn sie von der Quelle schon falsch gelesen werden... und auch wenn man mehrere Backups hat und alte aufhebt - wer will das wieder sortieren, wo die Daten ok sind?

    Ich entschied mich jetzt für ZFS ohne Verschlüsselung und hoffe, dass zfs-fuse da bald nachzieht. rsync hat built-in Verification, memtest lief auch erst und die RAIDs sind nur Ersatz für normale Platten - also Backup zwischen denen wie früher zwischen normalen Platten.

  • Nein, reicht mir nicht. Ich rechne die MTTF ja nicht für einen Totalausfall (im Fall von RAID 5 >= 2 Platten), sondern für Datenverlust. Und der kann schon auftreten, wenn nur eine Platte ein wenig Probleme macht. Ich hatte das leider schon öfters mit unterschiedlichen Platten...

    welches RAID verwendest du denn bei sowas (linux software RAID?)? ich kann mir beim besten willen nicht vorstellen, dass das im sinne der RAID erfinder ist. gibts dazu irgendwelche berichte in foren? ich hatte jedenfalls noch nie solche probleme und benutze ein normales ext3 für die datenpartition.
    es wär mir vollkommen neu, dass man für die datenkonsistenz bei RAID unbedingt ein spezielles dateisystem bräuchte.

    lg,
    oliver

  • ich kann mir beim besten willen nicht vorstellen, dass das im sinne der RAID erfinder ist.


    die "normalen" RAID level sind nicht wirklich fuer die heute ueblichen festplattengroeszen gedacht.

    angenommen man hat ein RAID5 mit 5 x 2TB. faellt nun eine platte aus, ist das RAID unsecured und du musst die platte aus den 4 uebrigen rebuilden. bei einem non-recoverable read error etwa alle 10^14 bits ergibt das:

    (4 * 2 * 1000^4 ) / (10^14 / 8) = 0.64

    also wird es mit einer 64% wahrscheinlichkeit zu einem fehler beim rebuild kommen.

  • welches RAID verwendest du denn bei sowas (linux software RAID?)? ich kann mir beim besten willen nicht vorstellen, dass das im sinne der RAID erfinder ist. gibts dazu irgendwelche berichte in foren? ich hatte jedenfalls noch nie solche probleme und benutze ein normales ext3 für die datenpartition.
    es wär mir vollkommen neu, dass man für die datenkonsistenz bei RAID unbedingt ein spezielles dateisystem bräuchte.

    Ja, das gefällt mir prinzipiell auch überhaupt nicht, dass man dafür ein besonderes Dateisystem braucht. Theoretisch kann man die Datenintegrität ja unterhalb des Dateisystems sicherstellen. Einfach von allen Platten lesen, Daten überprüfen und gut ist es.
    Leider macht das ein Standard-Linux-SW-RAID (ja, ein solches verwende ich, RAID-5 bzw. RAID-1) nicht und somit landen immer wieder kaputte Daten im Dateisystem. Das spezielle Dateisystem ist also eigentlich nicht unbedingt notwendig, aber im Fall von ZFS ist es eben nicht nur Dateisystem sondern gleichzeitig auch die scheinbar einzige Möglichkeit eines Software-RAIDs, das meine Anforderungen an Datenintegrität erfüllt.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!