私はRでtm-packageを使って文書用語行列を作成していますが、コーパス内の単語のいくつかはプロセスのどこかで失われてしまいます。 例について説明します。のは、私は、TM-パッケージからDocumentTermMatrix()を使用する場合、私はこの小さなコーパス library(tm)
crps <- " more hours to my next class bout to go hom
のテキストと最も高いランクの単語にマッチする、私は2つのデータフレーム、 DF1あります df1 <- c("A large bunch of purple grapes", "large green potato sack", "small red tomatoes", "yellow and black bananas")
df1 <- data.frame(df1)
DF2: Word
私はopenNLPのバージョン1.8でカテゴライザを構築しようとしていますが、下のコードでは私はNullPointerExceptionを得ています。私は間違って何をしていますか? public class test
{
public static void main(String[] args) throws IOException
{
InputStr