2016-05-18 6 views
1

私はRのtmパッケージの定性分析プロジェクトに取り組んでいます。私はコーパスを構築し、用語ドキュメントマトリックスを作成しました。短期間で私の用語ドキュメントマトリックスを編集し、その行。これを行うには、私はTermDocumentMatrixをRにインポートする

write.csv() 

を使用してRからそれを輸出してきた私は、当時RにCSVファイルをインポートしたが、RはTermDocumentMatrixまたはDocumentTermMatrixとしてそれを読むために取得する方法を見つけ出すのに苦労しています。

以下のサンプルコードの提案を無駄に使ってみました。

私の行列をコーパスと同じように、各セルを単一のドキュメントとして読み続けると思われます。

# change this file location to suit your machine 
file_loc <- "C:\\Documents and Settings\\Administrator\\Desktop\\Book1.csv" 
# change TRUE to FALSE if you have no column headings in the CSV 
x <- read.csv(file_loc, header = TRUE) 
require(tm) 
corp <- Corpus(DataframeSource(x)) 
dtm <- DocumentTermMatrix(corp) 

各セルは文書であるかのようにRは、CSVファイルを読み込むことなく、termdocumentmatrix又はdocumenttermmatrixとして読み取られるCSV形式のマトリックス中にインポートする方法はありますか?

答えて

0

あなたは文書を読んでいないので、Corpus()の手順をスキップしてください。 、次回のために

myDTM <- as.DocumentTermMatrix(x, weighting = weightTf) 

を変換する必要はありません。このよう.RDataとしてTDMオブジェクトの保存を検討し、また、はるかに効率的である:これは、直接動作するはずです。

0

データの形式を保持する場合は、save() functionを使用することをおすすめします。 任意のRオブジェクトを.RDataファイルに保存できます。また、データを取得する場合は、load()関数を使用できます。

関連する問題