2017-01-10 5 views
0

お客様からの請求書は常に同じ形式ですので、会計システムにインポートするためには、特定のExcel形式に操作する必要があります。カスタムスクリプトをExcelに変換するPDF

これを行うには最高のコーディング言語は何でしょうか?

おかげで、

ニック

答えて

0

トリッキーな部分は、PDFのうち情報を取得しているようですね。このために、OCRを使用することができます。これが完了したら、VBA(Office Automation)を使用してExcelに読み込むことができます。

ほとんどのOCR APIはテキストだけでなく、単語の座標(バウンディングボックス)も返します。ここでは自由OCR.space OCR APIからの例です:

APIの出力は、このようなJSONレスポンスです:同じ機能を持つ

{ 
    "ParsedResults": [ 
    { 
     "TextOverlay": { 
     "Lines": [ 
      { 
      "Words": [ 
       { 
       "WordText": "TEXT", 
       "Left": 279, 
       "Top": 89, 
       "Height": 40, 
       "Width": 107 
       } 
      ], 
      "MaxHeight": 40, 
      "MinTop": 89 
      }, 
      { 
      "Words": [ 
       { 
       "WordText": "WALKING", 
       "Left": 233, 
       "Top": 144, 

その他のAPIはGoogleクラウドビジョン、マイクロソフト認知サービスとABBYYだろう。

次の手順として、JSONファイルを解析して、特定のx/y範囲内の情報を探してExcelの特定のフィールドに割り当てることができます。

+0

ありがとう、私はこれを行う –

関連する問題