pdfbox

    0

    1答えて

    私はいくつかのExcelシートを持っていて、データを自動的にフィールドに入力したいと思っています。情報を入力できる場所に何らかの形でタグを付けることができるようにしたいと思います。だから、私はいくつかのapi(itext、pdfbox?)を使用して、これらのフィールドを塗りつぶすことができます。それは将来的には変更可能でなければならない。 最高のAPIとツールは何ですか? fdfなどを使用して、x

    2

    2答えて

    PDFBoxを使用してPDFからテキストを抽出しています。 PDFは非常にシンプルで、列は非常に幅広く離れています。 これはすべての種類の水平スペースが1つのスペース文字に変換されることを除いて、本当にうまく動作します。もはや列を分けることはできません(列内の単語内のスペースは、列間のスペースのように見えます)。 一般的な解決策は非常に難しいと思いますが、この場合は列が実際には離れているため、「長

    0

    1答えて

    最も効率的な方法でPDFをHTMLに変換したいと思っていました。 入力は64進数でpdfになり、出力はhtmlにする必要があります。 良いオープンソースもOK 誰でも手伝いできますか?

    3

    1答えて

    私は、pdfbox APIクラスLucenePDFDocumentによって生成されたインデックスを持っています。索引にはテキストの内容のみが含まれているため、この索引を効果的に検索したいと考えています。 私は検索文字列で 'contents'フィールドを検索します。結果の順序は関連性の低いものから関連性の低いものにする必要があります。以下のコードは、検索されたテキストの単語を含むファイルを表示しま

    3

    2答えて

    PDFImageWriterクラスを使用してPDFを画像ファイル(png)に変換しました。今私は、変換された画像ファイルから画像(画像)を切り抜きたい。どのようにすればいいのかわからない。あなたは、Javaを使用して画像をトリミングしようとしている場合

    1

    1答えて

    私はいくつかのことをこれにいくつかの光を当てることを願っています。 [SERIALIZE]オプションを指定してPDFBOXを再コンパイルする必要があるようです。しかし、私はどのようにするか分かりません。 私がやろうとしているのは、PDDocument docオブジェクトをデータベースに格納することです。 エラー:アセンブリ 'PDFBox、Version = 0.0.0.0、Culture = n

    0

    1答えて

    私のASP.netアプリケーションでPDFBOXを使用してPDFファイルを読むことはできますが、空のセルのためのスペースをテーブルに追加していません。 C#でPDFBOXを使用してPDFファイルから空のフィールドを読み込みます。 pdfファイルを読むための他の方法はありますか? ありがとうございました。テキストが正確にどこ事前にすべきであり、あなたはそれを抽出し、テキストの位置を取得することができ

    3

    1答えて

    私は次のことを達成したいと思います。私は一連のPDFファイルを持っていますが、まず座標系の原点を確認したいと思います。 pdfの座標系の原点が左上ではない場合(通常、原点は左下です)、左上の座標で結果のPDFを作成したいと思います。私はPDFBoxを使ってこれをしようとしています。[コードスニペットは下です]しかし、結果のPDFは空白になっています。間違っています。私はPDFBoxの初心者です。し

    2

    1答えて

    PDFBoxを使用するサーバー用の小さなプログラムを作成する必要があります。私はNetBeansでWindowsの下で書いています。一度PDFBoxをサーバーにエクスポートすると、PDFBox jarをプログラムjarに追加するにはどうすればよいですか?