私のBScの学位論文の一部として、ビデオフィードで画像認識を利用する必要があります。画像認識、始める方法
私はopenCVとTensorflow、特にInception訓練モデルを2つのオプションとして特定しましたが、そこからどのように進んでいくのかわかりません。基本的に私が必要とするのは、 "キー"のような文字列を渡すことです。上位5つの結果のうちの1つが "キー"であれば、ブール値を返します。
ちょうど言及すると、私は両方ともPythonを使用しているので、私はオンラインのpythonコースを行った。また、私はJavaについてかなりの経験を積んでいます。私たちは過去2年間ユニユを使用してきました。
私はではありません。は新しい画像認識システムを完全に作成する必要はありません。カメラを見ていることを教えてください。
また、動画ですが、実際の動画フィードを処理するのは難しいと思います。私が考えたのは、30フレームのうちの1フレーム(30fpsのビデオフィードを想定)を取り出し、その上で画像認識を実行することでした。
ありがとうございます!
画像認識システムのカメラがサイズ、距離、明るさ、動きなどの観点から見たオブジェクトの制約は何ですか? – JohnH
@JohnH私はあなたが求めているものを得ることはできませんが、私はすべき気がします。あなたはどのような状況になるのか、画像認識システムには何が必要なのか尋ねていますか? 編集:最初のケースでは、屋内でよく点灯します。指定されたオブジェクトが見つかるまで、カメラは動き回ります。 – MrUber
あなたのスコープは、どのオブジェクトを表示して識別できるかという点ではかなり広いようです。識別しようとしているオブジェクトのタイプを制限する場合は、作業負荷がより妥当な可能性があります。それが定義されると、その目標に向かって答えを提供することがより簡単になります。 – JohnH