vielleicht hat ja jemand antworten auf meine fragen, ich bin nach dem lesen einiger dokumentationen und grauslichem kernel code nicht wirklich schlauer.
der fehlerfall um den es mir geht ist "data corruption" auf einer disk im raid verbund, _nicht_ der ausfall der ganzen platte. wie dieser zustand zustande kommt ist egal. ich nehme einfach an das "write" hat noch funktioniert, dann ist ein boesewicht daher gekommen und hat mir auf einer platte ein paar bit umgeschupft.
was passiert nun bei einem read von raid1? soweit ich den kernelcode verstanden habe, kann es mir passieren dass ich von der guten platte lese, dann ist alles in ordnung. was passiert wenn ich von der platte lese wo die bits umgefallen sind? beschwert sich da das dateisystem? imo hat ext3 aber keine checksummen, und dem raid1 ist es auch egal denke ich. richtig?
kann ich mit anderen raid-levels meinen fehlerfall erkennen? soweit ich weisz kommen die paritybits bei raid5 ja auch nur zum einsatz wenn ein block verloren (also wieder totalausfall der platte) aufgetreten ist. wenn aber nur bits umgefallen sind, dann hilft mir ein raid5 genau so wenig, oder?
also meine fragen: wie kann ich data corruption auf dateisystem und/oder raid level erkennen. geht das mit standard raid und ext? wie koennte ich mir data corruption selber baun, also gezielt in ein file faults injecten? bzw nutzt mir das ueberhaupt etwas? wenn ext keine checksums rechnet (wovon ich ausgehe), bringt mir das dann so und so nichts. gibt es raid-level die checksummen ueber die daten rechnen bzw. von mehreren kopien im verbund die daten vergleichen?
ps: ich habe gelesen, dass alte HW-raid1 controller teilweise den inhalt beider platten gelesen haben und die daten verglichen haben. gibt es diesen "safety mode" auch fuers linux SW raid?
ich bin fuer alle hinweise dankbar, mfg. kampi