Foxit SDKを使用してテキスト形式のpdfを抽出する

私はFoxit SDKを使用してPDF文書からテキストを抽出しています。Foxit SDKを使用してテキスト形式のpdfを抽出する

すべては問題ありませんが、英語以外の言語でpdfを抽出すると、正しい出力が得られません。

私もPDFBoxをjavaで使用しましたが、Foxit SDKの出力はPDFBoxよりも優れています。

問題を解決できる他のライブラリがありますか？またはその他の解決策があります。

2012-01-27 Tushar Agarwal

これを試してください。 http://www.codeproject.com/Articles/14170/Extract-Text-from-PDF-in-C-100-NET –

@ShoaibShaikhはい私はこれを試みたが、英語とは別にpdfと離れていても動作していない。 .iは空白の出力を与えます。 :( –

私はあなたがUnicodeのchar範囲を特定し、選択領域を抽出する必要があります..これは私が言及した記事で使用されているpdfparserである、それを変更する必要がありますhttp：///www.codeproject.com/Articles/7056/Code-to-extract-plain-text-from-a-PDF-file –