2016-12-19 7 views
0

LSFジョブスケジューラで動作するようにテンソルフローを設定するには? LSFの経験はほとんどありません。 tf.train.ClusterSpecには、ワーカーおよびパラメータサーバのIPアドレスが必要です。 LSF環境からそれらを得ることは可能ですか?一緒に働くという成功事例はありますか?Tensorflow + LSF。 LSFクラスタ上の分散テンソルフロー

EDIT:

はSLURMクラスターRunning TensorFlow on a Slurm Cluster?に同様の目標を達成するためにどのようにいくつかの説明を見つけました。基本的に、私はLSFジョブスケジューラ用のこのようなものを探していますが、

答えて

1

LSF hereのTensorFlowのブログ投稿とサンプル起動スクリプトがあります。

0

これはLSFで行うことができますが、推奨しません。あなたがDockerを使用してそのルートに行くことができるなら、私がお勧めするのはそれです。 LSFには他の合併症がたくさんあり、間違っている可能性があります。 Plus TensorFlowは、LSFのようなシステム上で動作するように設計されていませんでした。

Docker SwarmとComposeは、この特定の問題で過去に私のためにうまくいきました。

関連する問題