私は、テンソルフローモデルにロードするようなカスタム形式のIDのトレーニングサンプルファイルを用意していますが、データを効率的に解析する方法を見つけることはできません。テンソルはuint8テンソルをfloat32テンソルとして表示
ファイルには、機能の数、ラベルの数、サンプルの数などを記述する20バイトのヘッダーがあります。ヘッダーの後にいくつかの例が続きます。それぞれの例は、フィーチャーを表すいくつかのfloat32であり、その後にラベルを表すいくつかのuint8が続きます。したがって、残りのファイルはfloatとuintの交互パターンです。
私はuint8sのベクトルとしてファイルを取得するためにtf.read_file
とtf.decode_raw
を使用して、そして今、IDラベルからの特徴をスライスし、リトルエンディアンの順序でのfloat32ベクトルとしての機能ベクトルを表示したいとしています。このようなことは、テンソルフローで可能ですか?
私はnumpy
でファイルを正常に解析し、フィーチャーとラベルをtf.constant
に変換しましたが、テンソルフローに直接ロードする方がメモリ効率が良いようです。