2017-12-24 9 views
0

完全な畳み込みネットワーク用にデータセットを準備しようとしています。私はいくつかのデータセットを見てきましたが、フォーマットする方法を考えるのは本当に苦労しています。完全畳み込みネットワークのデータセットをフォーマットする方法は?

画像1enter image description here

画像2enter image description here

テキスト:たとえば、Kittiデータセットでは、これらの2枚の画像とトレーニングフォルダでこのテキストファイルがあります

P0: 7.215377000000e + 02 0.000000000000e + 00 6.095593000000e + 02 0.000000000000e + 00 0.000000000000e + 00 7.215377000000e +02 1.728540000000e + 02 0.000000000000e + 00 0.000000000000e + 00 0.000000000000e + 00 1.000000000000e + 00 0.000000000000e + 00 P1 :7.215377000000e + 02 0.000000000000e + 00 6.095593000000e + 02 -3.875744000000e + 02 0.000000000000e + 00 7.215377000000e + 02 1.728540000000e + 02 0.000000000000e + 00 0.000000000000e + 00 0.000000000000e + 00 1.000000000000e + 00 0.000000000000e + 00 P2:7.215377000000e + 02 0.000000000000e + 00 6.095593000000e + 02 4.485728000000e + 01 0.000000000000e + 00 7.215377000000e + 02 1.728540000000e + 02 2.163791000000e-01 0.000000000000e + 00 0.000000000000e + 00 1.000000000000e + 00 2.745884000000e- 03 P3:7.215377000000e + 02 0.000000000000e + 00 6.095593000000e + 02 -3.395242000000e + 02 0.000000000000e + 00 7.215377000000e + 02 1.728540000000e + 02 2.199936000000e + 00 0.000000000000e + 00 0.000000000000e + 00 1.000000000000e + 00 2.729905000000e-03 R0_rect:9.999239000000e-01 9.837760000000e-03 -7.445048000000e-03 -9.869795000000e-03 9.999421000000e-01 -4.278459000000e-03 7.402527000000e-03 4.351614000000e-03 9.999631000000e-01 Tr_velo_to_cam。 7.533745000000e-03 -9.999714000000e-01 -6.166020000000e-04 -4.069766000000e-03 1.480249000000e-02 7.280733000000e-04 -9.998902000000e-01 -7.631618000000e-02 9.998621000000e-01 7.523790000000e-03 1.480755000000e-02- 2.717806000000e-01 Tr_imu_to_velo:9.999976000000e-01 7.553071000000e-04 -2.035826000000e-03 -8.086759000000e-01 9.88840000000e-04 9.998898000000e-01 -1.482298000000e-02 3.195559000000e-01 2.024406000000e-03 1.482454000000e- 02 9.998881000000e-01 -7.997231000000e-01 Tr_cam_to_road:9.999570839814e-01 -5.508724949246e-03 -7.452906591504e-03 9.610489538319e-03 5.425697507328e-03 9.999234779341e-01 -1.111504746388e-02 -1.597134401910e 00 7.513565886504e-03 1.107413060494e-02 9.999104059534e-01 2.788606298060e-01

このデータセットは、私がCNNsに使用されて見てきた正規のデータセットから非常に異なっています。したがって、次の質問がありました。

  1. テキストファイルでは何が起こっていますか?
  2. ベタ塗りのピクセルで2番目の画像を生成するにはどうすればよいですか?
  3. FCNの提案された利点の1つは、任意のサイズの入力画像を供給することができることです。入力画像をどのくらい小さくできますか?50x50が小さすぎますか?私はこれを取り巻く文献を探しましたが、それほど多くは見つかりませんでした。

本来、私はこのnetwork from this githubを使用するデータセットを作成しようとしています。トレーニングのためのフォルダは2つしかありません:training_img_lmdbtraining_label_lmdbです。だから、私はテキストファイルやピクセル化された画像がラベルフォルダに入っているかどうかは確かではありません。どんな助けでも大歓迎です!!

答えて

0
  1. は明確にしてくださいなどTr_cam_to_road、Tr_velo_to_cam、から...通常データセットがドキュメント

  2. を持つことになり、テレメトリのいくつかの種類のように見えます。あなたは画像を投稿しました。確かにイメージをロードする方法は分かっていますか?

  3. 純粋に畳み込み型のネットワークは、単一の出力ピクセルの入力近傍サイズに等しい最小入力サイズを持ちます。

関連する問題