2017-02-22 8 views
1

私は主にテキストを抽出するためにGoogle Vision APIを使用しています。私は正常に動作しますが、入力行をスキャンするAPIが必要な特定の場合は、次の行に移動する前にテキストを吐き出します。しかし、APIは、左側で上から下にスキャンし、右側に移動してトップからボトムスキャンを行う何らかのロジックを使用しているようです。 APIが左から右に読んだり、下に移動したりするなど、私は好きだったでしょう。例えばテキスト抽出 - 行単位

、画像考える:

“ Name: John Doe DOB: 01-Jan-1970 Gender: M Lives In: LA ” 
:私はこのような何かを期待しているだろう、一方で

“ Name DOB Gender: Lives In John Doe 01-Jan-1970 LA ” 

:API

John Doe - Profile

を次のようにテキストを返します。

ブロックサイズまたはmaを定義する方法があるとしますイメージ/スキャンを行単位で読み込む設定(?)?

ありがとうございました。 あなたも行あたりの境界に基づいてテキストを抽出することができアレックス

答えて

0

、あなたは、この2つの単語が同じ「行」であるboundyPolyを使用して、例えば同じライン

"boundingPoly": { 
     "vertices": [ 
      { 
      "x": 87, 
      "y": 148 
      }, 
      { 
      "x": 411, 
      "y": 148 
      }, 
      { 
      "x": 411, 
      "y": 206 
      }, 
      { 
      "x": 87, 
      "y": 206 
      } 
     ] 

内のテキストを連結することができます

"description": "you", 
     "boundingPoly": { 
     "vertices": [ 
      { 
      "x": 362, 
      "y": 1406 
      }, 
      { 
      "x": 433, 
      "y": 1406 
      }, 
      { 
      "x": 433, 
      "y": 1448 
      }, 
      { 
      "x": 362, 
      "y": 1448 
      } 
     ] 
     } 
    }, 
    { 
     "description": "start", 
     "boundingPoly": { 
     "vertices": [ 
      { 
      "x": 446, 
      "y": 1406 
      }, 
      { 
      "x": 540, 
      "y": 1406 
      }, 
      { 
      "x": 540, 
      "y": 1448 
      }, 
      { 
      "x": 446, 
      "y": 1448 
      } 
     ] 
     } 
    } 
+0

おかげで、それは1つの可能性です。 –

0

これは遅い回答かもしれませんが、将来の参考のために追加してください。 JSONリクエストに機能のヒントを追加して、目的の結果を得ることができます。

{ 
    "requests": [ 
    { 
     "image": { 
     "source": { 
      "imageUri": "https://i.stack.imgur.com/TRTXo.png" 
     } 
     }, 
     "features": [ 
     { 
      "type": "DOCUMENT_TEXT_DETECTION" 
     } 
     ] 
    } 
    ] 
} 

非常に離れたテキストの場合、DOCUMENT_TEXT_DETECTIONは適切な行分割も行いません。

次のcodeは、文字ポリゴン座標に基づいた単純な線分を行います。

enter image description here

https://github.com/sshniro/line-segmentation-algorithm-to-gcp-vision

+0

私はこのコードを見て、それは非常に短いですが、私はJavaでそれを使用したいと思います。 –

+0

構文はほぼ同じです。アルゴリズムはポリゴン計算ライブラリを使用するので、同様のライブラリを使用して、ポイントがJavaのポリゴンの内側にあるかどうかを調べる必要があります。 –

+1

ありがとう、私はjavaでcodded:2つの長方形のスペースの重なり –

関連する問題