PDFドキュメントをJavaの単一のHTMLファイルに変換しようとしています。ほとんどのコンバーターは、1つのPDFファイルを複数のHTMLファイルに変換します。 PDF全体を1つのHTMLファイルに変換したい。PDFファイルを単一のHTMLファイルに変換する
提案がありますか?
PDFドキュメントをJavaの単一のHTMLファイルに変換しようとしています。ほとんどのコンバーターは、1つのPDFファイルを複数のHTMLファイルに変換します。 PDF全体を1つのHTMLファイルに変換したい。PDFファイルを単一のHTMLファイルに変換する
提案がありますか?
私はあなたのPDF文書をitextで解析し、次にあなたのhtmlファイルを生成することができるはずだと思います。 私はそれが実行可能かどうかを確認していないことを認めなければなりません。
あなたは、常に複数のHTMLファイルのそれぞれのbody
を組み込んだ単一の文書を書くためにJSoup APIを使用して、いくつかのコードを書くかもしれません。スタイルを組み合わせると、(特に元のHTMLが 'id'要素を使用する場合)、スタイルシート(CSS)のスタイルが少し複雑になることがあります。
私はそれは難しいはそこに「単一のドキュメントが」オプションであるコンバータがないと信じて見つけるのに。私はさらに検索することをお勧めします。
あなたはhttp://www.jpedal.org/html_index.phpを見ましたか?これは単一のファイルに書き込むことができますか?
テキストのみを抽出するのか、フォーマットしていますか? –