0
私は、Twitterデータ(1ファイルのみ)を含むtxtファイルを持っています。 streamRとparseTweets関数を使ってRにロードしました。このデータをKmeansクラスタリングする必要があります。まず、私はデータを整理して準備する必要がありますが、データは数字の混在です。
このデータから不要な文字をすべて削除するにはどうすればよいですか?私はプレーンテキストだけが必要です。数字、特殊文字などなしKmeansクラスタリングとテキストマイニングR
*library(streamR)
install.packages("RCurl")
install.packages("bitops")
install.packages("rjson")
library(bitops)
library(RCurl)
library(rjson)
library(NLP)
library(tm)
library(SnowballC)
library(XML)
tweets.df<-parseTweets('tweetsStream.txt', simplify = FALSE);
tweets.df<-tm_map(tweets.df,content_transformer(tolower));
Error in UseMethod("tm_map", x) :
no applicable method for 'tm_map' applied to an object of class "data.frame"*