2016-04-29 10 views
1

を通過した後、私はRAID1データとRAID1のメタデータとのbtrfsとしてフォーマット2つの比較的新しい4Tハードディスクドライブ(WDデータセンターの再WD4000FYYZ)を持っています。変更されていないファイル上のbtrfs訂正不能なエラーがスクラブ

私は、ボリューム(〜76ギガバイト)に大きなバイナリファイルをコピーしました。すぐにファイルをコピーした後、私はbtrfsスクラブを実行しました。エラーはありませんでした。

数ヵ月後、スクラブは、そのファイルにエラーを返しました。最初にコピーされて以来、変更されていません。私は、両方のドライブのSMART属性がエラー(Current_Pending_Sectorまたはそれ以外)を示していないことを追加することがあります。

ドライブを搭載したシステムは、ECCメモリがありません。

このようなエラーが発生する可能性があるのは、大きなファイルのチェックサムの一部と同じブロックにデータチェックサムが含まれている別のファイルに書き込む際に、メモリ内に何らかの破損が発生した悪質なデータが大きなファイルの1つ以上のチェックサムを汚染することを許していました。

残念ながら、私はbtrfsに移行することを望んでいました。データがロードされて正常にスクラブされたら、(raid1/5/6の設定で)書き込まれなかったとしても残っていると確信できます。明らかに、これはそうではありません。

誰もこれが起きている可能性がどのように説明できますか?また、大きなファイルを含むボリュームのスナップショットを撮った場合でも、元のスナップショットから破損していないデータにアクセスできましたか?

+0

memtestを実行しましたか?多分badblocks?ファイル名はdmesgに記載されていますか?これは何時でもVMでですか?他のファイルやinodeも壊れていますか?それが壊れる前に何か特別なことが起こったのか、システムが高負荷か何かの下にあったのでしょうか? – basic6

+0

私はこれを投稿した後、btrfsメーリングリストについて幅広く議論しました。私は、実際には、悪いメモリチップを持っていました。場合によっては、ビットまたはビットがチェックサムブロックの破損を反転することがあります。データそのものは良好でしたが、ミラーリングされたチェックサムは、メモリエラーが発生したために悪いものでした。私はラムを交換し、問題は再現されませんでした。 –

+0

それで、それはそれを説明します。悪い記憶はあらゆる種類の損傷を引き起こす可能性があります。これはbtrfsのためには起こりません。実際、btrfsはメモリの問題を発見するのに役立ちました。また、どのファイルが壊れているかを教えてくれました。あなたの質問に対する答えとしてこれを投稿することをお勧めします。 – basic6

答えて

1

このサイレントデータの破損は、メモリスティックの不良によって発生しています。メモリが交換され、問題は再現されませんでした。

関連する問題