2016-07-20 6 views
1

このpdfページthis is the pdf screenshotを.xlsファイルに変換する必要があります。C#でxls形式に変換する方法は?

+3

こんにちは、歓迎、StackOverflowへ。ヘルプページ、特に[ここではどのトピックについて聞かせていただけますか?](http://stackoverflow.com/help/on-topic)と[質問しないでください。」](http://stackoverflow.com/help/dont-ask)。さらに重要なことは、[Stack Overflow question checklist](http://meta.stackexchange.com/q/156810/204922)をお読みください。また、[最小、完全、および検証可能な例](http://stackoverflow.com/help/mcve)についても知りたいことがあります。 – lokusking

+1

あなたは "this" pdfのみを変換しますか?値をコピーするだけです。 :-) – wischi

+0

これはサンプルではありません。この種類のpdfをxlsに変換するだけです。 –

答えて

1

PDF解析ライブラリを使用してテキストを抽出できるはずです。これは非常に簡単に不可能になる可能性があります。テーブルが内部的にどのように表現されるかによって異なります。イメージとして表現されている場合は、OCRライブラリも必要です。最も簡単なケースでは、文字列としてすべてのテキストを抽出し、タブやその他の空白に従って改行や列に従って行を分割することができます。

は、このいずれかを試してみて、何が起こるかを参照してください。http://www.squarepdf.net/parsing-pdf-files-using-itextsharp

編集を:私は読んでPDFの一部に焦点を当てました。 Excelへの書き込みは、簡単なGoogle検索でカバーされています。

+0

画像はサンプルで、その種類のpdfをxlsに変換するだけです。 –

+0

ええ、私の答えはそのケースをカバーする必要があります。これらのPDFはすべて一般的に異なっていますか?異なるプログラムによって作成された数字のテーブルを持つPDFの一般的なケースを解決したい場合、またはこれが常に同じプログラムによって生成された標準レポートのようなものであると想定することができます。完全な一般的な解決策はもちろん、特定のものより難しくなりますが、私の答えは良い出発点になるはずです。 – Kurt

関連する問題