2012-05-01 14 views
3

クラスタ上でMPIおよびCUDAコードを実行しようとしています。コードは、単一のマシン上で正常に動作しますが、私は、クラスタ上でそれを実行しようとすると、私はエラーを取得:libcudart.so.4:共有ライブラリのロード中に共有ライブラリの読み込み中にエラーが発生しました:libcudart.so.4:共有オブジェクトファイルを開くことができません:そのようなファイルまたはディレクトリがありません

エラーをそのようなファイルやディレクトリ

ません:共有オブジェクトファイルを開くことができません。

PATHとLD_PATHを確認しても問題ないです。

export PATH = $ PATH:/ usr/local/lib/openmpi:/ usr/local/cuda/bin export LD_LIBRARY_PATH =次のエントリを含む.bashrcファイルがあります。 $ LD_LIBRARY_PATH:/ usr/local/lib:/ usr/local/lib/openmpi /:/ usr/local/cuda/lib

すべてのマシンにはCUDAとOpenMPIの同じインストールがあります。

私も、誰もこれで私を助けることができるは/etc/ld.so.conf

では/ usr/local/CUDA/libがあります。この問題は本当に面倒です。

ありがとうございました。

+0

クラスタを初期化するために何を使用していますか? – rudolph9

答えて

5

クラスタ上のバッチジョブを送信する場合は、あなたのバッチスクリプトに

echo $LD_LIBRARY_PATH 
ldd ./your_app 

のようなコマンドを追加してください。これは、問題をデバッグするのに役立ちます。

また、mpirunで環境変数をエクスポートすることを確認してください。たとえば、OpenMPIでコードを実行すると、

mpirun -x LD_LIBRARY_PATH ... 
+0

mpirun -x LD_LIBRARY_PATHは私の問題を解決します。ありがとう。あなたは私の一日を作った。 – Coder

関連する問題

 関連する問題