2017-02-17 9 views
0

私は、テンソルフローモデルにロードするようなカスタム形式のIDのトレーニングサンプルファイルを用意していますが、データを効率的に解析する方法を見つけることはできません。テンソルはuint8テンソルをfloat32テンソルとして表示

ファイルには、機能の数、ラベルの数、サンプルの数などを記述する20バイトのヘッダーがあります。ヘッダーの後にいくつかの例が続きます。それぞれの例は、フィーチャーを表すいくつかのfloat32であり、その後にラベルを表すいくつかのuint8が続きます。したがって、残りのファイルはfloatとuintの交互パターンです。

私はuint8sのベクトルとしてファイルを取得するためにtf.read_filetf.decode_rawを使用して、そして今、IDラベルからの特徴をスライスし、リトルエンディアンの順序でのfloat32ベクトルとしての機能ベクトルを表示したいとしています。このようなことは、テンソルフローで可能ですか?

私はnumpyでファイルを正常に解析し、フィーチャーとラベルをtf.constantに変換しましたが、テンソルフローに直接ロードする方がメモリ効率が良いようです。

答えて

0

すべて固定サイズのデータ​​であると仮定すると、演算子Slicing and Joiningを使用してデータをデインターリーブする必要があります。次に、画像データにdecode_rawout_dtype=tf.float32を使用し、再度スライスしてベクトルを個別に取得することができます。

関連する問題