2016-03-18 3 views
5

COMPSアプリケーションを送信した後、次のエラーメッセージが表示され、アプリケーションは実行されません。COMPSs - すでにノードにエラーが記入されています

MPI_CMD=mpirun -timestamp-output -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/user/runcompss 
--project=/tmp/1668183.tmpdir/project_1458303603.xml 
--resources=/tmp/1668183.tmpdir/resources_1458303603.xml 
--uuid=2ed20e6a-9f02-49ff-a71c-e071ce35dacc 
/apps/FILESPACE/pycompssfile arg1 arg2 : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 1 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 2 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc 

-------------------------------------------------------------------------- 
All nodes which are allocated for this job are already filled. 
-------------------------------------------------------------------------- 

私はCOMPSs 1.3を使用しています。

なぜこれが起こっていますか?

+0

実行したコマンドに関する詳細情報を投稿できますか? –

+0

コマンドを含めるために質問を編集しました。 –

答えて

5

マスタとワーカーを同じノードで実行しようとしています。 NIOアダプタ(デフォルトオプション)を持つクラスタのCOMPS 1.3は、mpirunを使用してクラスタの異なるノードにマスタプロセスとワーカープロセスを起動しており、クラスタにインストールされているmpirunはこれを許可していません。それを解決するために

オプションは次のとおりです。

  1. あなたはenqueue_compssコマンドで= --tasks_in_master指定しないでください。あなたはより多くのオーバーヘッド

次COMPSsソフトウェアリリースは、(別のクラスタリソースマネージャで使用可能なSPAWNコマンドを使用する持つGATアダプタ(--comm = integratedtoolkit.gat.master.GATAdaptor)で実行さ

  • この問題を解決しなければならないblaunch、srunなど)

  • +2

    パーフェクト!私はGATアダプターを使用して私の問題を解決しました。しかし、NIOアダプタがより効率的であることを理解しているので、次のリリースが公開されるとすぐにCOMPSを更新します。 あなたの迅速で正確な対応に感謝します。 –

    関連する問題