2016-03-29 12 views
-1

私はファイルformatting.docを持っています。それにはテキストがあります。ドキュメントのテキストに書式を追加しました。私は最初の段落の開始前にスペースを追加し、いくつかの単語に下線を引いて、太字でいくつかの単語を作って、段落を中央で正当化しました。Javaの形式でファイル(ワードドキュメント、Excel)からデータを読み取る方法は?

私のアプリケーションでは、Apache POIを使用してファイルを読み込み、iTextを使用してPDF形式で表示しようとしました。しかし、Apache POIが返すテキストは生データです。すなわちフォーマットを行わない。

ファイルのテキストをすべての書式で読み取る方法はありますか。

+0

いくつかのコードを示してください。コードがないと何が間違っているのかを知るのは難しいです。 – kichik

答えて

0

最高のオプションはApache Tikaです。これはApache POIと他のいくつかのライブラリを使用し、他のものの中からフォーマットされた抽出を提供します。

関連する問題