2012-01-30 27 views
2

PDFドキュメントをJavaの単一のHTMLファイルに変換しようとしています。ほとんどのコンバーターは、1つのPDFファイルを複数のHTMLファイルに変換します。 PDF全体を1つのHTMLファイルに変換したい。PDFファイルを単一のHTMLファイルに変換する

提案がありますか?

+0

テキストのみを抽出するのか、フォーマットしていますか? –

答えて

0

私はあなたのPDF文書をitextで解析し、次にあなたのhtmlファイルを生成することができるはずだと思います。 私はそれが実行可能かどうかを確認していないことを認めなければなりません。

3

あなたは、常に複数のHTMLファイルのそれぞれのbodyを組み込んだ単一の文書を書くためにJSoup APIを使用して、いくつかのコードを書くかもしれません。スタイルを組み合わせると、(特に元のHTMLが 'id'要素を使用する場合)、スタイルシート(CSS)のスタイルが少し複雑になることがあります。


私はそれは難しいはそこに「単一のドキュメントが」オプションであるコンバータがないと信じて見つけるのに。私はさらに検索することをお勧めします。

関連する問題