私はあなたと同じ問題を抱えていましたが、そこに記載されているログファイルのパスを変更することで解決しました。multiple slurmd support。例
SlurmdLogFile=/var/log/slurm/slurmd.log
SlurmdPidFile=/var/run/slurmd.pid
SlurmdSpoolDir=/var/spool/slurmd
のためのあなたのslurm.confで は今、あなたは複数のslurmdを起動することができ
SlurmdLogFile=/var/log/slurm/slurmd.%n.log
SlurmdPidFile=/var/run/slurmd.%n.pid
SlurmdSpoolDir=/var/spool/slurmd.%n
でなければなりません。
注:私はあなたのslurm confで試してみましたが、いくつかのパラメータが1つではなく2つのNodeNameを定義し、どのノードを各ノードに使うかを追加するようなものはないと思います。 これは私のために働きます
# COMPUTE NODES
NodeName=linux[1-10] NodeHostname=linux0 Port=17004 CPUs=1 State=UNKNOWN
NodeName=linux[11-19] NodeHostname=linux0 Port=17005 CPUs=1 State=UNKNOWN
# PARTITIONS
PartitionName=main Nodes=linux1 Default=YES MaxTime=INFINITE State=UP
PartitionName=dev Nodes=linux11 Default=YES MaxTime=INFINITE State=UP
私は上記のようにインストールを構成しましたが、実行中のワーカーデーモンは1つだけです。 –
@PaulSchimmerはい!しかし、すべてのノードをエミュレートします。 'sinfo'を実行しようとすると、あなたが表示されます。 – siserte
私は次のエラーに直面しています: 'Slurmストリームソケットの接続エラー127.0.1.1::接続が拒否されました'何が原因でしょうか? –
Alper