これは私が私のTDM行列を得た方法である:TDM行列にダミー変数を追加
doc1 doc2 doc3 ... doc10000
term1 . 1 1 ... 1
term2 . . 1 ... .
...
term99 1 . 1 ... 1
私は何をしたいことは次のとおりです:
doc1 doc2 doc3 ... doc10000 class
term1 . 1 1 ... 1 1
term2 . . 1 ... . 0
...
term99 1 . 1 ... 1 0
doc.vec <- VectorSource(data$text)
doc.corpus <- Corpus(doc.vec)
tdm <- TermDocumentMatrix(doc.corpus, control = list(wordLengths = c(2, Inf)))
私のオリジナルのTDM行列は次のようになります
classは、クラス0またはクラス1に含まれるかどうかを示す0/1ダミーです。
私はこのクラスダミーをデータ$ classによって呼び出された元のデータに定義しました。 そして、私のTDMに ``転送」この変数への道があるかどうか、私は疑問に思って
はどうもありがとう
編集:以前は不明であるために申し訳ありません - 私の元のクラスのダミードキュメントのためでした。私がしようとしているのは、クラスを用語に再割り当てすることです.1はクラスがクラス1にのみ出現することを意味し、0はクラス0にのみ出現することを意味します。
'tdm $ class < - data $ class' – Sumedh
また、' cbind(tdm、data $ class) 'は動作するはずです。 – steveb
早い者には申し訳ありませんが、私の元のクラスのダミーは、用語用ではなく、ドキュメント用です。そして私がやろうとしているのは、クラスを用語に再割当てすることです.1はクラス1にのみ表示され、0はクラス0にのみ表示されることを意味します – Shane