Harddisk - Verzweiflung

  • Ich habe hier 2 Seagate SATA (NCQ) 160GB Festplatten. Und die bringen mich jetzt echt zur Verzweiflung.
    Es sind beides Festplatten, die von Seagate RMA repariert wurden.

    Oracle gibt mir jetzt (nach mehreren DB Backup-Versuchen) einen Error:
    "Reread of blocknum=37015, file=/u01/oradata/proddb/PRODDB/datafile/o1_mf_system_1xwzkcnv_.dbf. found same corrupt data"

    (Es geht dabei darum, dass ein Block einer Datendatei nicht richtig gelesen werden kann)
    Sowas darf nicht auftreten. Auf meiner 80GB Seagate SATA ist das nie aufgetreten.


    Es kommt noch schlimmer:
    Die mit hddtemp ausgelesene Temparatur beträgt 34°. (Ist normal oder?)
    Die Festplatte fühlt sich "normal" warm an...(ich fühle immer mit der Rückseite meiner Finger - HD = etwas wärmer als meine Hand)

    Woran kann das liegen? Selbiger Fehler trat bereits auf den letzten beiden Disks auf (die repariert wurden) - zuerst trat der Fehler nur manchmal auf...dann 2 Tage gepaart mit Linux-IO-Fehlern, dann war die Festplatte komplett defekt = unansprechbar.


    Es kann nichts mit dem Filesystem zu tun haben (ist noch ganz neu)...
    Memtest habe ich angefangen, dann abgebrochen...(glaub nicht dass es daran liegt)
    Chassis ist open...an der Wärme kann es kaum liegen. Eingeschaltet war der PC seit gerade mal 1-2 Stunden bis der Fehler kam (nach einigen Backups). - Ich habe eben versucht den Fehler zu provozieren, aber der dürfte gar nicht kommen. Und es ist nicht jedes Mal derselbe Block. Vor 2 Tagen waren bei einer Select Query noch ein anderer "defekt".

    Vorschläge? Bin echt am Verzweifeln.

    P.S: Hatte mir schon überlegt 2x Western Digital Raid Edition zu kaufen, weil die für Dauerbetrieb "zugelassen" sind...aber nicht mal 2h hat der Server die Backups (= sehr festplattenintensiv) durchgehalten - dann kann's ja nicht mit der Betriebszeit zusammenhängen...

  • Versuch mal die Platten mit den diagnostic tools zu checken.
    Gibts auf der seagate page.

    Religion ist ein Glaube,
    Wissenschaft als Teilgebiet ist ein Glaube,
    die Wahrheit liegt in der Gegenwart des Menschen.

  • Post mal die SMART-Daten. Weiß jetzt für Linux kein Tool, aber für Windows kannst ja mal nach "DTemp" suchen.

    In einen FBO rendern ist wie eine Schachtel Pralinen - man weiß nie, was man kriegt.

  • hab die beide Festplatten dem Seagate Quick Check unterzogen, sowie 1 davon dem 1.5 stündigen SurfaceScan. Keine Fehler.
    smartmontools mag meine Festplatten leider nicht, da sie SATA-Interface haben, habe ich soeben festgestellt.

    außerdem werde ich heute
    a) einen ausführlichen Memtest machen.
    b) die andere Festplatte /dev/sdb auch stressen (weil seit ich die 2 neuen repaired hds habe, kam der Fehler nur von Festplatte /dev/sda)

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!