2017-12-05 27 views
0

ansysに問題があります。私がそれを始めると、いくつかのパーティションについて不平を言う。私たちはslurmを使用しています。ジョブが実行されるslurmパーティションについて不平を言っていますか?しかし、RDMAはより多くのハードドライブパーティションを聞きます。私は少し問題の原因が混乱している。 slurmのファイルシステムまたは異なるキュー(パーティション)へのアクセス?それを修正する方法。以前にこのバグに遭遇したことはありますか?Ansys MPI_Init_thread:複数のpkeyが見つかりました/パーティションキーテーブル/ MPI_IB_PKEY

これは、NFS/opt(ansysインストール)とBeeGFS/work dir(モデルなど)を持つs​​lurmクラスタ上で実行されています。

cfx5remote: Rank 0:35: MPI_Init_thread: multiple pkey found in partition key table, please choose one via MPI_IB_PKEY 

cfx5remote: Rank 0:35: MPI_Init_thread: pkey table: 

cfx5remote: Rank 0:35: MPI_Init_thread: 0x8001 

cfx5remote: Rank 0:35: MPI_Init_thread: 0x7fff 

cfx5remote: Rank 0:25: MPI_Init_thread: multiple pkey found in partition key table, please choose one via MPI_IB_PKEY 

cfx5remote: Rank 0:25: MPI_Init_thread: pkey table: 

cfx5remote: Rank 0:35: MPI_Init_thread: 0xffff 

cfx5remote: Rank 0:25: MPI_Init_thread: 0x8001 

cfx5remote: Rank 0:25: MPI_Init_thread: 0x7fff 

cfx5remote: Rank 0:25: MPI_Init_thread: 0xffff 

cfx5remote: Rank 0:25: MPI_Init_thread: ibv_get_pkey() failed 

cfx5remote: Rank 0:21: MPI_Init_thread: multiple pkey found in partition key table, please choose one via MPI_IB_PKEY 

cfx5remote: Rank 0:25: MPI_Init_thread: Can't initialize RDMA device 

答えて

0

cfx5remote:ランク0時25分:MPI_Init_thread:パーティションキーテーブルで見つかった複数のPKEY、MPI_IB_PKEY

cfx5remoteを経由していずれかを選択してください:ランク0時25分:MPI_Init_thread:ibv_get_pkey()が

を失敗しました - >これはinfiniband/rmdaであり、あなたのファイルシステムとはまったく無関係です。 tcshシェルの場合

+0

我々は異なるOpenMPIのバージョンを持つノード間のイーサネットとomnipathリンクを持っています。私の推測では、AnsysはイーサネットリンクかOmnipathリンクかを判断できません。 ansysにOmnipathを使用するように指示する方法はありますか? – Networkguy

0

"0xffffの"

のsetenv MPI_IB_PKEYは、 "VLAN"、 "放送" を使用するようにアプリケーションを強制します。なぜ複数のパーティションが選択されているのかわかりません。 bashシェルの場合

輸出MPI_IB_PKEY = "0xffffの"

関連する問題