2012-04-24 10 views
2

私は、日本語のHTMLページからテキストやコンテンツをアップロードし、カーソルを使用してテキスト/コンテンツ内の単語を選択して英語に翻訳できるプロジェクトに取り組んでいます。しかし、私はこの機能をPDFファイルに拡張したいと考えています。基本的に、私は、ユーザーがPDFファイルを提出し、ブラウザがそのPDFファイルをレンダリングして、PDF内の単語を選択/強調表示すると、ブラウザは何らかの形でjavascriptなどの強調表示されたセクションは、PHP変数に中継されます。PHP - PDFからユーザーが選択したテキストを読むための回避策?

私は、同様の質問をしているstackoverflowの投稿がたくさんあることを知っています(私は何時間も時間をかけてそれらを整理しようとしました!)が、これが可能かどうかの決定的な答えは見つけられないようです。 PDFをHTMLに変換したり、PDFからテキストを抽出したりするオプションはたくさんあるようですが、正直言って、私が達成しようとしているものと関連があるのであれば混乱します。そして、私はAdobe用のjavascript APIがあることを知っていますが、私は、javascriptをPDFに埋め込む必要があるという印象を受けています。ユーザーが独自のPDFファイルをアップロードしてレンダリングしている場合は当てはまりません。可能であれば、Adobe JavaScript APIにネイティブテキスト選択サポートがないようです。

これを行うには簡単な回避策(擬似疑問)がありますか?ここでも、PDFで選択されたテキストを変数に渡すことができます。その効果は、ユーザーが知らない単語をハイライトすることで、その単語を単語バンクに追加して辞書で検索することができます。

私が何かをより明確にすることができるかどうか教えてください。ありがとうございました!

答えて

0

あなたは、PDFをHTML(this answersを参照)に変換することをお勧めします。

+0

それはおそらく理想的な解決策です。しかし、私が問題にしているのは、変換中に日本語フォントを扱うことができるライブラリを見つけて、すべてをゴミ箱に混乱させることなく見つけることです。そのための解決法はありますか、または私は最終的に英語のPDFテキストをHTMLに変換する能力を持つだけに制限されていますか? – braunsg

+0

私は、PDFからの変換を行ってからしばらくしていましたが、それでも私は日本語を扱っていませんでした。しかし、あなたが推測しなければならないのは、変換ライブラリがUTF8をサポートしていないか、または日本語を表示できるフォントがインストールされていないことです。 –

+0

Hmmm、そうです。私は、UTF8自体のネイティブなサポートに走っています。たぶんこれは実現可能ではない...私は仕事について考えて別の方法を見つける必要があります、それは... – braunsg

関連する問題