私はテンソルフローの初心者です。テンソルフローの論理を学ぶためには、公式のMNISTサンプルコードから始めます。しかし、私が気にしていないことの1つは、MNISTの例では元のデータセットをいくつかの圧縮ファイルとして提供しています。その形式は初心者には分かりません。このケースでは、データセットをバイナリファイルとして提供するCifar10も使用されています。私は実践的な深い勉強の仕事で、私たちのデータセットは、*.jpg
または*.png
のような多くの画像ファイルであり、各ファイルのラベル(ImageNetデータセットのような)を記録したテキストファイルもあります。例としてMNISTを使ってみましょう。Tensorflowでトレーニング用のデータセットとしてディレクトリに画像ファイルをロード
MNISTには、サイズが28 x 28
の50kトレーニングイメージが含まれています。これらの画像がjpg形式であり、ディレクトリ./dataset/
に保存されていると仮定しましょう。
label.txt
はこのようなものです
/path/to/dataset/
image00001.jpg
image00002.jpg
... ... ... ...
image50000.jpg
label.txt
:
#label.txt:
image00001.jpg 1
image00002.jpg 0
image00003.jpg 4
image00004.jpg 9
... ... ... ...
image50000.jpg 3
今、私は単層モデルを訓練するためにTensorflowを使用したい./dataset/
では、我々は、各画像のラベルを格納したテキストファイルlabel.txt
を持っていますこれらのデータセット。誰かが簡単なコードスニペットを与えるのを助けることができますか?