2016-06-01 7 views
1

を失敗し続ける:トルクtrqauthd私はqstatのを実行すると、私はエラーを次取得

socket_connect_unix failed: 15137 

socket_connect_unix failed: 15137 

socket_connect_unix failed: 15137 

qstat: cannot connect to server (null) (errno=15137) could not connect to trqauthd 

qstat: Error (15137 - could not connect to trqauthd) 

私は「ps aux | grep trqauthd」 を実行し、trqauthdがプロセスに記載されていました。

trqauthdを再実行するとすべてが機能し、psには2つのtrqauthdが表示されます。

5〜6日間使用してからもう一度エラーが発生します。

答えて

0

デーモンプロセスがまだ存在しても応答しない場合は、再起動するだけで問題を解決することができますが、これはバグのように聞こえます。あなたは、gdbでそれを実行し、デバッグのためのコアを生成するようなことをする上であなたを導くことができるかどうかを確認するために、torqueusersメーリングリストを通じて開発者に確認するかもしれません。最新のバージョンでは、古いinitスタイルのスクリプトを置き換えるためのシステムサポートが追加されていますので、check-and-restartサービスディレクティブを追加するか、trqauthdを再起動(または終了と再起動...)するcronスクリプトを作成することができますしばしば、仕事の中断を防ぐためです。

関連する問題