2016-11-17 12 views
1

私はpdf.jsを使用していますフォント情報pdf.js埋め込みフォントに関する情報を取得

Object { 
    str: "blabla", 
    dir: "ltr", 
    width: 191.433141, 
    height: 12.546, 
    transform: Array[6], 
    fontName: "g_d0_f2" 
} 

と私はブロックを取得し、テキストを取得することでg_d0_f2について何らかの形でより多くの情報を得ることです。

+0

ドキュメント化されていないAPIを使用すると、objにはcommonObjsプロパティ(https://github.com/mozilla/pdf.js/blob/master/examples/svgviewer/viewer.js#L29)があります.ttf/otfデータが表示されます、あなたはそれを解析し、必要なすべての情報を見つけることができます:) – async5

答えて

0

注意PDF.jsのgetTextContentは、PDFのグリフと一致しないとみなされます。 PDF32000仕様には、テキストの表示と抽出のための2つの異なるアルゴリズムがあります。 page.commonObjsでフォントデータを検索することができますが、グリフエンコーディングの不一致のために抽出されたテキストコンテンツの表示にはあまり役立たない場合があります。

ページのgetTextContentはテキスト抽出を行い、getOperatorListは(グリフ)表示演算子を取得します。 src/display/svg.jsレンダラーがグリフを表示する方法を参照してください。

関連する問題