2

1台のマシンで複数のワーカーデーモンを実行したい。 damienfrancois'sによると、what is the minimum number of computers for a slurm clusterで答えることができます。問題は現在、1台のマシンで1つのワーカーデーモンしか実行できません。私はlinux2を実行すると、たとえば複数のワーカーデーモンの実行SLURM

私は

sudo slurmd -N linux1 -cDvv 
sudo slurmd -N linux2 -cDvv 

linux1を実行してダウン。 1台のマシンで複数のワーカーデーモンを実行できますか? は、ここに私のslurm.confファイル

答えて

3

あなたの意図はただSLURMの動作をテストしているようだとして、私はあなたが同じマシンにダミー計算ノードを作成することができますフロントエンドモードを、使用することをお勧めしますです。そのFAQ

、あなたはより多くの詳細を持っていますが、基本的には、このモードで動作するようにインストールを設定する必要があります。

./configure --enable-front-end 

そして

NodeName=test[1-100] NodeHostName=localhost 

slurm.confにノードを構成しますこのガイドでは、ポートを変更して同じノードで複数の実際のデーモンを起動する方法についても説明しますが、テスト目的のために必要ではありませんでした。

幸運を祈る!

+0

私は上記のようにインストールを構成しましたが、実行中のワーカーデーモンは1つだけです。 –

+0

@PaulSchimmerはい!しかし、すべてのノードをエミュレートします。 'sinfo'を実行しようとすると、あなたが表示されます。 – siserte

+0

私は次のエラーに直面しています: 'Slurmストリームソケットの接続エラー127.0.1.1::接続が拒否されました'何が原因でしょうか? – Alper

0

私はあなたと同じ問題を抱えていましたが、そこに記載されているログファイルのパスを変更することで解決しました。multiple slurmd support。例

SlurmdLogFile=/var/log/slurm/slurmd.log 
SlurmdPidFile=/var/run/slurmd.pid 
SlurmdSpoolDir=/var/spool/slurmd 

のためのあなたのslurm.confで は今、あなたは複数のslurmdを起動することができ

SlurmdLogFile=/var/log/slurm/slurmd.%n.log 
SlurmdPidFile=/var/run/slurmd.%n.pid 
SlurmdSpoolDir=/var/spool/slurmd.%n 

でなければなりません。

注:私はあなたのslurm confで試してみましたが、いくつかのパラメータが1つではなく2つのNodeNameを定義し、どのノードを各ノードに使うかを追加するようなものはないと思います。 これは私のために働きます

# COMPUTE NODES 
NodeName=linux[1-10] NodeHostname=linux0 Port=17004 CPUs=1 State=UNKNOWN 
NodeName=linux[11-19] NodeHostname=linux0 Port=17005 CPUs=1 State=UNKNOWN 
# PARTITIONS 
PartitionName=main Nodes=linux1 Default=YES MaxTime=INFINITE State=UP 
PartitionName=dev Nodes=linux11 Default=YES MaxTime=INFINITE State=UP 
関連する問題