から多くの列にテキスト分析は:前処理:私のデータフレームの特定の列に前処理テキストにそれが可能である次の行を使用したデータフレーム
#text to lower case
df$name <- tolower(df$name)
#remove all special characters
df$name <- gsub("[[:punct:]]", " ", df$name)
#remove long spaces
df$name <- gsub("\\s+"," ",str_trim(df$name))
私はすべての列で、この前処理ルールを実装したいと思います(このようなデータフレームのIDを)期待して:あなたは何かを複数回行いたい場合には、例えばfunction.
、Yを定義しておくと便利です
df <- data.frame(id = c("A","B","C"), D = c("mytext 11","mytext +", "!!"), E = c("text","stg","1.2"), F = c("press","remove","22"))
あなたがすべきあなたが回答を受け取る場合は、データサンプルを提供してください。 – Seymour
@Seymourご覧のとおり、私はサンプルデータを提供しています。 – PitterJe