2016-03-23 45 views
1

R、 'tm'パッケージを使用して.pdfファイルを読み込む際に問題があります。 は具体的に、私は次のコードを実行しよう:Windowsにpdftotextをインストールする(R、 'tm'パッケージ用)

library(tm) 
filename = "myfile.pdf" 

tmp1 <- readPDF(PdftotextOptions="-layout") 
doc <- tmp1(elem=list(uri=filename),language="en",id="id1") 
doc[1:15] 

...私にエラーを与える:

Error in readPDF(PdftotextOptions = "-layout") : 
    unused argument (PdftotextOptions = "-layout") 

私は、これはそのpdftotextプログラム(のxpdfの一部に起因していると仮定します、http://www.foolabs.com/xpdf/download.html)が私のマシンに正しくインストールされていないため、Rはアクセスできません。

上記のRコードを実行できるようにxpdf/pdftotextを正しくインストールするにはどうすればよいですか?(すでに似た質問が掲載されていることは承知していますが、同じ問題は解決していません)

+0

'readPDF'を' -layout'オプションなしで呼び出すとどうなりますか? –

+0

パッケージpdftoolsを使用してみてください。これにより、xpdfをインストールする手間が省けます。 – phiver

+0

@Karsten:-layout設定なしでコードを実行すると、次のエラーが表示されます。>>> system2( "pdftotext"、c(control $ text、shQuote(x)、 " - ")エラー、stdout = TRUE) '"pdftotext"' not found <<< – SuperUser01

答えて

1

のパラメータはreadPDFではありません。 readPDFにはcontrolというパラメータがあり、これにはリストが必要です。だから、正しい使用は、次のようになります。

if(all(file.exists(Sys.which(c("pdfinfo", "pdftotext"))))) { 
    tmp1 <- readPDF(control = list(text = "-layout")) 
    doc <- tmp1(elem=list(uri=filename),language="en",id="id1") 
} 
+0

これは一見するとうまくいくようです。私はそれをさらに調べた後すぐにあなたの答えを受け入れます。 – SuperUser01

0

設定

setwd('C:/xpdf/bin64')     

それは私のために動作します。

関連する問題