2012-03-22 6 views
-1

C#を使用してMS Officeファイルの内容を抽出したいとします。 例:私はdoc/docx/xls/xlsx/ppt/pptxを開き、テキストや情報(ページ数 - 単語数、シート数 - Excel、スライド数 - ppt、数字グラフの数 - Excelの数、画像の数 - パワーポイント、等など)。 Windows iFilterを使用してテキストを抽出できることに気づきました。しかし、これは私にテキストを与えるだけです。誰かが私にこのような情報を与えることができるDLLなどを知っていますか?そうでなければ、オフィスXMLファイルのスケルトンを詳細に説明するサイトはありますか?MSオフィスのプロパティの抽出

答えて

1

でダイビングする前に自分自身を配向させるためにWikipediaの記事を読む価値がありますという無料の図書館を利用して、尋ねたことを達成することができます。

- 私は自由のライブラリーの知らない(/古いバイナリ)のdoc/xlsファイル用

/PPTこれをサポートするいくつかの商用ライブラリがあります

商用ライブラリは、通常の機能の非常に豊富なセットを提供します - これはおそらく良い選択です

+0

... PDFに例の輸出用。おそらく、私はプログラムでdocxをdocxに変更し、OpenXML SDKを呼び出すことができました。 – nunoaac

関連する問題