2017-11-06 9 views
0

最近iTextの体験版をダウンロードしました。 は、私は次の目標を達成しよう:iTextでアクセス可能なPDFファイルを作成する

  • は、既存のPDFファイルを操作するなどWORD、PP、エクセル
  • からPDFドキュメントを作成します。
  • (最も重要な) - ファイルは、私は次のコードを試してみました

WCAG 502要件(PDF/UA)に応じて無効のフルアクセスとして変換/作成する必要があります:(C#)を

LicenseKey.LoadLicenseFile(@"D:\Development\itextkey-0.xml"); 
    PdfDocument pdfDoc = new PdfDocument(new PdfReader(SRC), new PdfWriter(DEST, new WriterProperties().SetPdfVersion(PdfVersion.PDF_1_7))); 
    pdfDoc.SetTagged(); 
    pdfDoc.GetCatalog().SetLang(new PdfString("HE-IL")); 
    pdfDoc.GetCatalog().SetViewerPreferences(
      new PdfViewerPreferences().SetDisplayDocTitle(true)); 
    PdfDocumentInfo info = pdfDoc.GetDocumentInfo(); 
    info.SetTitle("iText7 PDF/UA example"); 
    pdfDoc.Close(); 

しかし、Acrobat Readerでチェックした後、「タグなし」PDFファイルとしてマークされた出力ファイル。

私は目標を達成するためにiTextをどのように使用するべきかアドバイスしてください。

+0

タグ付けには、人間の知能が必要です。ソフトウェアが(一般的に)人間の介入なしにドキュメントに正しくタグ付けすることは期待できません。私は、あなたのコードのどこにでもタグを導入しているとは思わない。埋め込まれていないフォントを置き換えるためのフォントプログラムを提供しているとは思われません。コードサンプルが適切にタグ付けされたPDFファイルを作成しないことは、通常のことです。要件を満たしておらず、機会を丁寧に拒否していることを誰にでも伝えてください。あなたが「箱から出して」実行できると主張するソフトウェアを見つけた場合:それを信用しないでください! –

+0

また、SRCパスがワード文書に解決された場合、新しいPdfReader(SRC)が動作するとは思わないでください。私は、この機能が大好きです。しかし、それは起こることはありません。 –

答えて

1

できません。

最も簡単な証拠を教えてください:
入力文書に、糸球に匹敵する2匹の猫の画像が含まれているとします。

pdf/UAには、のあなたの想像上の代替テキストを挿入する必要があります。
現時点では、あなたが投げた任意のランダムな画像に対して感覚的なキャプションを提供できるシステムはありません。

どのシステムでも画像のキャプションが表示されても、完璧な翻訳サービスにリンクする必要があります。ほとんどの画像認識サービスは英語で書かれているので、あなたが書いている言語ではないかもしれません。

目を想像して今

  • 翻訳
  • 言語検出
  • をタグ付け

    • :3つのめちゃくちゃハードの問題は、単に画像を処理することができるようにします電子

      • テーブル
      • グラフやチャート
      • のような楽しいことの他の種類の..

      はさらに、PDF/UAが埋め込まれるフォントが必要です。埋め込まれていないフォントを使用するPDFに直面した場合はどうでしょうか。これらのフォントの代わりに使用できるフォントプログラムにアクセスできますか?

      スニペットではPdfReaderを使用し、ファイルにはSRCのパスを指定します。 Word、PPTなどのファイルを変換する必要がありますが、iTextはWord、PPTなどをPDFに変換しません。 PdfReaderは、PDFファイルのみを受け入れます(名前が示すとおり)。

    関連する問題