大量のファイル(1ファイルにつき平均2MBの数千の異なるファイル)を同時に処理する必要があります。多くのファイルを同時に処理する - NFS経由でファイルをコピーするか、またはNFS経由で読み取りますか?
すべての情報は1つの(1.5TB)ネットワークハードドライブに保存され、約30種類のマシンで処理されます。効率を上げるために、各マシンは異なるファイルを読み込み(処理する)必要があります(何千ものファイルが処理される必要があります)。
すべてのマシンは、1.5TBハードドライブの 'incoming'フォルダからファイルを読み込んだ後、情報を処理し、処理された情報を 'processed'フォルダに出力します。 1.5TBドライブ。すべてのファイルの処理情報は、入力ファイルとほぼ同じ平均サイズです(ファイルあたり約2MB)。
(1)全ての加工機用M、そのローカルハードドライブにMによって処理され、その後、&プロセス読まれるすべてのファイルをコピーします。行うには良いことですが何
マシン上のローカルファイルM。
(2)ファイルをすべてのマシンにコピーするのではなく、すべてのマシンが 'incoming'フォルダに直接(NFSを使用して)アクセスし、そこからファイルを読み取り、ローカルで処理します。
どのアイデアが優れていますか?そのようなことをしているときに、「do」と「donts」はありますか?
30台のマシンを持っているので、同じネットワークドライブに情報を同時に読み込むのは問題ですか?
(注:既存のファイルは追加/書き込みされず、新しいファイルは最初から作成されるため、同じファイルへの複数のアクセスの問題はありません...)。私が期待すべきボトルネックはありますか?
(Iは、Linux、Ubuntuのすべてのマシン上の10.04 LTSそれならばすべての事項を使用しています)
ありがとうBrad。 – user3262424