2016-08-30 4 views
0

私はどのように異なる入力の重みとどのようにコストを計算するために使用されます、基本的にこのundertand:より深いネットワークを行うために使用することができる方法機械学習は多次元データをどのように扱いますか?

enter image description here

ともしますが、どのようにネットワークの契約を持つだろういくつかのデータが継承されてバンドルされているrgbイメージのようなもの?

+1

ネットワークでは、通常、** hidden-layers **を使用して、これらの機能(何らかの形で関連付けられている)を組み合わせる方法を学習します。この場合、最終的な線形活性化(あなたの写真に見られるように)はsingle.dimensionsではなく、いくつかの(場合によっては非線形の)多くのフィーチャ/ディメンションの組み合わせに作用します。 – sascha

答えて

0

イメージがw * hピクセル(w =幅、h =高さ)であると仮定します。

最も簡単な方法は、単純にw * h * 3入力ノードを作成することです。 3つの入力ノード(R値用、G値用、B値用)トレーニング用に十分な大きさのデータセットがあれば、このようにデータを分割することは問題ではありません。

最初はいくつかの情報を失うことは間違いありません。最初の3つの入力ノードは何らかの形で(同じピクセル)、それ以降の3つの入力ノードは関連していることを伝えるネットワークの構造に本質的に何もありません。十分な量の訓練データが与えられれば(理論的には)そのようなパターンでピックアップすることができます。

問題のドメインによっては、単に色情報を取り除くだけでも効果的です。代わりに、画像をグレースケールに変換すると、ピクセルあたり1つの入力ノードしか必要としません。明らかにこの方法でも情報を失うことがありますが、情報によっては必要でない場合もあります(それを取り除くことで、トレーニングの効率性が向上します)。

関連する問題