2017-09-29 5 views
0

私はRTextToolsパッケージ(hereとCRANマニュアルで、私が.txtファイルに解決したいくつかのドキュメントをテキストマイニングするために)を使いたいと思います。 GitHub.txtファイルをread_data(RTextTools)を使用してデータフレームに追加します。 CSV参照でエラーが発生しました

フォルダのパス名を取るのread_dataテキストファイル、およびCSVラベリングファイル名と研修値を読み取ります。

私が実行したテキストファイルの私のディレクトリには、このコマンド

df_text <- read_data(filepath = getwd(),type = "folder",index = paste0(getwd(),"/dir-3.csv") 

     Error in data.frame(Text.Data = frame, Labels = labels_fixed) : 
     arguments imply differing number of rows: 3, 292 

     In addition: Warning messages: 
     1: In readLines(filename) : incomplete final line found on 'C:/contracts/pdfs/text 

私のCSVファイルされます読みたいファイル名を列挙した2列だけです。私は後で変更するつもりです:

filename.txt | # 
    x.txt  | 2 
    y.txt  | 2 
    z.txt  | 2 

これらのエラーメッセージを修正するにはどうすればよいですか?

+0

あなたのデータはtxtファイルで処理します。 txtファイルの列数が異なっています。 – Santosh

答えて

0

の関係上、機能条件:ディレクトリ内のファイルの数である、あなたのCSVの行数であると

length(files) 

nrow(labels) 

この問題を解決する最も簡単な方法は、ディレクトリ内のファイルとインデックス内のファイルを1対1で対応させることです。それを除いて、あなたのディレクトリにないファイルは、あなたのディレクトリにはないので、あなたのディレクトリを見ていなくても大丈夫です。

インデックスファイルの2番目の列で問題が発生している可能性もあります。たぶんそれを取り除くか、数値の代わりに文字列を与えてみてください。

関連する問題