私はいくつかの表音記号(IPA)(ʤ、əなど)を持つPDFファイルを持っています。 その記号でテキストをコピーすると、テキストなしでテキストが貼り付けられます。LinuxでPDFのIPAシンボルをコピーできないのはなぜですか?
、Linuxのミント17
私はいくつかの表音記号(IPA)(ʤ、əなど)を持つPDFファイルを持っています。 その記号でテキストをコピーすると、テキストなしでテキストが貼り付けられます。LinuxでPDFのIPAシンボルをコピーできないのはなぜですか?
、Linuxのミント17
私が使用apache tikaを示唆しています。インストール後、次のコマンド例を使用してください:
java -jar tika-app-1.0.jar ‐‐text <document.pdf> document.txt
スレッド "main"の例外java.net.MalformedURLException:プロトコルなし - テキスト \t at java.net.URL。
pdfをtxtに変換せずにテキストをコピーする方法はありますか? – Piter
オンラインpdf to txt converter :) –
pdf抽出プログラムを使用できます –
PDF抽出プログラムとは何ですか? – Piter
pdfエクストラクタ - コンバータpdfからテキスト –