C#を使用してMS Officeファイルの内容を抽出したいとします。 例:私はdoc/docx/xls/xlsx/ppt/pptxを開き、テキストや情報(ページ数 - 単語数、シート数 - Excel、スライド数 - ppt、数字グラフの数 - Excelの数、画像の数 - パワーポイント、等など)。 Windows iFilterを使用してテキストを抽出できることに気づきました。しかし、これは私にテキストを与えるだけです。誰かが私にこのような情報を与えることができるDLLなどを知っていますか?そうでなければ、オフィスXMLファイルのスケルトンを詳細に説明するサイトはありますか?MSオフィスのプロパティの抽出
-1
A
答えて
1
でダイビングする前に自分自身を配向させるためにWikipediaの記事を読む価値がありますという無料の図書館を利用して、尋ねたことを達成することができます。
- 私は自由のライブラリーの知らない(/古いバイナリ)のdoc/xlsファイル用/PPTこれをサポートするいくつかの商用ライブラリがあります
- Aspose.Words(DOCとDOCX)
- Aspose.Cells(XLSとXLSX)
- Flexcel(XLSとXLSX)
- SpreadSheetGear(XLSとXLSX)
- Aspose.Slides(PPTおよびPPTX)
- Spire.Office(DOCとDOCXとXLSとXLSX)
商用ライブラリは、通常の機能の非常に豊富なセットを提供します - これはおそらく良い選択です
1
オフィスXML形式がここで説明されています
http://msdn.microsoft.com/en-us/library/aa338205(v=office.12).aspx
これは、DOCX/XLSX/PPTX MSの提供のために
関連する問題
- 1. オブジェクトの抽出プロパティ
- 2. デコードMSオフィスの二重引用符?
- 3. MSオフィスのホットキーを無効にする
- 4. MSオフィスの自動クリックイベントをキャプチャする
- 5. アンドロイドアプリケーションでMSオフィスのファイルを表示
- 6. プロパティを抽出
- 7. アスペクトのプロパティ抽出 - Alfresco
- 8. msプロジェクトのTask.Durationプロパティ
- 9. opencv C++とMS VS2010を使用したフォアグラウンド抽出の問題
- 10. C#でMSオフィスをプログラミングすることは可能ですか?
- 11. オフィス内の.xlsx
- 12. オフィスのコンビネーションボタン/プルダウン
- 13. リストされたオブジェクトのリストからのPython抽出プロパティ
- 14. XMLからの要素名とプロパティ値の抽出
- 15. Objective-CでMSプロジェクトから情報を抽出するには?
- 16. オブジェクトのNSArrayからプロパティを抽出する
- 17. Xamlのスタイルからセッター値プロパティを抽出するには?
- 18. 単語ファイルの "Last updated by"プロパティを抽出する
- 19. 抽象ファクトリパターンとプロパティ
- 20. エクスプレスチェックアウトトークンの抽出
- 21. 式の抽出
- 22. リード/ライトマルチメディア/オフィス
- 23. ベースクラスの抽出ポインタ
- 24. リファクタリング:インタフェースの抽出
- 25. PHP RegEXの抽出
- 26. 抽出ユーザーのコメント
- 27. size_tテンプレートパラメータの抽出
- 28. MATLABのビート抽出
- 29. Unity3Dパッケージの抽出
- 30. SCORMクイズデータの抽出
... PDFに例の輸出用。おそらく、私はプログラムでdocxをdocxに変更し、OpenXML SDKを呼び出すことができました。 – nunoaac