0
前処理済みのコーパスから1つを作成しようとすると、次のエラーをスローするtmパッケージのRを使用して用語ドキュメント行列を作成できません。R内のtmパッケージを使用してTermDocumentMatrixを作成する際にエラーが発生しました
Error in UseMethod("TermDocumentMatrix", x) :
no applicable method for 'TermDocumentMatrix' applied to an object of class
"character"
以下は私が使用しているスクリプトです。私はtmパッケージv0.7-1でR v3.4.1を使用しています。
data <- readLines("Data/en_US/en_US_sample.txt", n = 100)
data <- Corpus(VectorSource(data))
data <- tm_map(data, removePunctuation)
data <- tm_map(data, removeNumbers)
data <- tm_map(data, content_transformer(tolower))
data <- tm_map(data, removeWords, stopwords("en"))
data <- tm_map(data, stripWhitespace)
words <- TermDocumentMatrix("data")
私はTermDocumentMatrixはので、私はtm_mapを使用してPlainTextDocumentために私のコーパスを強要しようとしたが、それは問題を解決していませんいくつかの指定されたテキスト文書形式であることをコーパスを必要と考えています。私のテキストデータをVectorSourceでCorpusを使用してロードすると、作成されたオブジェクトはクラスがSimpleCorpusと表示されていますが、これは完全にはわかりません。
ご協力いただければ幸いです。ありがとう!