OCRフォームの認識(データ抽出)について、さまざまな記事を見て、フォーム認識を行うためにニューラルネットワークを使用していると言いました。そのため、人工ニューラルネットワーク(ANN)とフォーム認識の関係は何ですか?ビジネスカードからフィールドを抽出する場合は、ANNを使用する必要がありますか、それともオプションですか?言い換えれば、いつANNを使用する必要がありますか?OCRと人工ニューラルネットワークの関係は何ですか?
答えて
少し異なります。 ANNはすべてのOCRの「エキスパート」です。しかし、OCRエンジンには多くの専門家がいます。 ANNを学ぶと、ANNだけを使って簡単なOCRエンジンを構築できますが、これはtri-gram、形態、データ型(BCRとFormsにとって非常に重要です)、辞書、接続コンポーネントアルゴリズムそれで、それを品質の結果を抽出するためのトリックの袋の中のただ一つのツールとして見てください。良いエンジンは、ANNと他のすべてを組み込むでしょう。 BCRでは、追加の考慮事項があり、接続されたコンポーネント、辞書には非常に重いものにし、ANNとパターンマッチングを使用して実際に認識する必要があります。
ANNはOCRを実行する1つの方法です。他にもあります。したがって、ANNを使用してBusinessCardからフィールドを抽出する場合は、オプションです。
良い質問です。私は最近OCRを行うGoogleプロジェクトであるOCRopusで遊んでいました。あなたは無料でそれを入手して、自分で遊ぶことができます。私はそれの背後にあるモジュールの1つとしてANNを持っていると確信しています。しかし、光学式文字認識の全プロセスは、多くのステップ(それぞれが何かを行い、結果を次のモジュールに渡す多数の異なる小さなモジュール)を持つことができます。
だから、ここで私はそのプロジェクト内のモジュールによって行われるものとして覚えているものをいくつか紹介します。黒と白にイメージを回したモジュールがありました
- - これはそれが簡単に後からモジュールになり扱う。
- スペックル/スペックルを除去すること。
- テキストの行を整列させる。個々の単語にテキストの
- 破る行は、ニューラルネットを含まないコードの小さなビットを使用して、上記行うことができ、
基本的には(それがこの1わからない数週間、となっています)。したがって、これらの小さなコードで簡単に処理できます。
私は思ったニューラルネットは、個々の文字を認識するために使用されています - 可能な文字のグループの文字はそれです。
私は1週間以上走っていたOCRopusにトレーニングコマンドがあり、ラインサンプルをマップに送っていて、地図がゆっくりと変化していました。私はそれがANNの部分を訓練していたと思います。
- 1. 人工ニューラルネットワークの深さ
- 2. ディープラーニングと伝統的な人工ニューラルネットワークの学習の違いは何ですか?
- 3. 人工ニューラルネットワークはスポーツゲームの結果を予測できますか?
- 4. 人工ニューラルネットワーク:初期ニューロンの選択
- 5. ニューラルネットワークによる人工生命
- 6. 人工ニューラルネットワーク(Tic-tac-toe)のコーディング方法は?
- 7. 人工ニューラルネットワークまたは「生物」ニューラルネットワークライブラリ/ソフトウェアを使用していますか?
- 8. 1:何人の関係に参加しますか?
- 9. Javascript:工場とは何ですか?
- 10. DAO工場パターンとは何ですか?
- 11. EnumとEnumerationの関係は何か
- 12. 人工知能とエキスパートシステム
- 13. IS-A関係とHAS-A関係の違いは何ですか? Java
- 14. 流暢NHibernateと友人の関係
- 15. ブレンドとは? WPFとの関係は何ですか?
- 16. JavaScript/HTML/jQueryとの関係で ".el"とは何ですか?
- 17. 人工蜂コロニーライブラリー
- 18. 人工知能
- 19. ユーザー間の人間関係
- 20. MyISAMテーブルのphpMyAdminでは "内部関係"とは何ですか?
- 21. tomcatとjdkとwebアプリケーションの関係は何ですか?
- 22. AppDelegateとRootViewControllerとUIApplicationの関係は何ですか?
- 23. XOauthとOAuthとの関係は何ですか?
- 24. Rails3 - テスト - 関係エラーとは何ですか?無効ですか?
- 25. これは友人関係の適切な使用ですか?
- 26. Intelのコアi *とコアの数の関係は何ですか?
- 27. javascriptのNumberとFunction.prototypeの関係は何ですか?
- 28. CRITICAL_SECTIONとCCriticalSectionの間の関係船は何ですか
- 29. masksToBoundsとcornerRadiusの間の関係は何ですか?
- 30. GoogleのApp Engine SDKとCloud SDKの関係は何ですか?
私は名刺からフィールドを抽出するために使用できる他の方法は何ですか? –
OCRの場合、通常は文字認識のためのモジュール(ANN、SVMなど)を必要とします。まず、ブロック、ライン、カラムを抽出し、正規化、スケール、入力イメージを回転させる必要があります... – alfa
SVMとは何か、それを学ぶ記事はありますか?行、列を抽出し、入力イメージを正規化、拡大縮小、回転させる方法に関する記事 –