現在、私はPuma.NETで作業しており、検索可能なPDFファイルにスキャンされたマルチページtifを変換しました。しかし、このテキストpdf上にイメージを生成する機能を提供するオープンソースライブラリはありますか?この方法で元のtifファイルはpdf形式で保存され、ocrテキストは隠されていますが、選択や検索に使用できます。PDFに隠されたocrテキストを追加する方法
クイックレスポンスありがとうございました。私の既存の図書館が結果を達成するために動かないなら、私は確かにQuickPDFにショットを与えるでしょう。 :-)
Btw、私はちょうど良いアイデアを得ました。私はiTextSharpを使ってそれを行うことができると思う。しかし、私はiTextSharpの初心者として2つの質問があります。
1)サイズの異なるページをPDFに追加するにはどうすればよいですか? 2)SetAbsolutePositionやその他の関数を使用して、特定のページに画像レイヤーを追加する方法は?
上記の質問にiTextSharpコードを提供できる人がいれば、それは素晴らしいことです!
私はOCRのPDFテキストフォーマットに画像レイヤーを追加しましたが、位置は保持されません。クイックPDF版で可能ですか? –
各OCRデータの座標があれば、DrawTextBox(x、y、w、h、text、alignment)を使って不可視テキストをかなり正確に配置できます。 どのOCRエンジンを使用していますか? Tesseract 2.xxを使用している場合は、OCRテキストのx、y、w、hの位置にアクセスする可能性はほとんどありません。 –
残念ながら、私には座標がありません。私はいつでも無料の解決策がないと思われるので、この質問をいつも開いておくと思います。 –