クラウドMLでTensorflow 1.3(およびおそらく1.4)を使用したいと思います。クラウドML上のマルチGPUマシン上のイム実行中のジョブクラウドML TensorflowとCudnnのバージョン互換性
私はsetup.pyでtensorflowのバージョンを指定することで、以下のようにそれを行う:クラウドMLにインストールされているcudnnライブラリです
from setuptools import setup
REQUIRED_PACKAGES = ['tensorflow==1.3.0']
setup(
name='my-image-classification',
install_requires=REQUIRED_PACKAGES,
version='1.0',
packages=['my_image_classification',
'my_image_classification/foo',
'my_image_classification/bar',
'my_image_classification/utils'],
)
何?それはtensorflow 1.3とtensorflow 1.3+と互換性がありますか?
私は、ジョブを開始することができましたが、パフォーマンスが期待値よりも10倍低い、とライブラリ
編集の根本的なリンクに問題がある場合、私は興味:
私はクラウドMLのCudnnバージョンがTensorflow 1.3に必要なものと一致しなくなったのでかなり自信があります。私は、Tensorflow 1.3のジョブに "Tensorflowデバイスの作成(/ gpu:0 ...)"が表示されないことに気付きました。クラウド上のデフォルトのTensorflowでジョブを実行すると表示されるログ
TensorFlow r1.3でクラウドMLに実際にモデルを導入できたのはどこですか?私は数週間前にそれを試みたが、それは不可能だった。実際、サポートされているランタイムバージョンはr1.0とr1.2です。ここには、cloud.google.com/ml-engine/docs/runtime-version-listがリストされています。しかし、r1.3でno https://cloud.google.com/ml-engine/docs/versioning#specifying_custom_versions_of_tensorflow_for_trainingで説明されています。私は、デプロイされたノードは、setup.pyではREQUIRED_PACKAGESが定義されていても、予測では定義されていないものの標準インストールを行うと思います。 – Guille
はい。実行時にはまだサポートされていませんが、これが回避策です。 gcloud submit job ..コマンドに--runtime-version = HEADコマンドライン引数を使用します。また、setup.pyにREQUIRED_PACKAGESを指定する必要があります。受け入れられた答えの下のコメントを参照してください。 – wrecktangle
ええ、それはそれを作った:)ありがとう! TF1.4でモデルを訓練して展開することもできますが、驚くほどオンライン予測を行うことはできますが、バッチ予測はできません。 – Guille