私は数えたい特定の音声パターンを持っています。コラム1の俳優とコラム2の文章のタイプがあります。私はIRF/IREという会話パターンをプログラム的に特定したいと思っています。パターンはこれです:複数行と列のパターンの出現をカウントします
- I - >教師
- R問い尋ねる - (通常答えを)>学生が応答を
- F/E - >教師が評価されるか、生徒の解答 にフィードバックを与えます
私は、1欄の教師 - 生徒先生を探していますか? - [。!] - [?。]に対応しています。
したがって、次の行を以下の偽のデータでは、このパターンを満たすとカウント:
33 Teacher ?
34 Student .
35 Teacher .
私はこのデータを視覚的に検査しました。どのように私は、基本的に以下の行列パターンが何であるかを見つけることができる:
| Teacher | ? |
| Student | [.!] |
| Teacher | [?!.] |
それは物事が速く/容易になります場合、私は、任意の外部のパッケージに開いています。
n <- 100
set.seed(10)
dat <- data.frame(
actor = sample(c("Teacher", "Student"), n, TRUE, c(.6, .4)),
type = c(sample(c('?', '.', '!'), n, TRUE, c(.3, .5, .1)))
)
head(dat)
## actor type
## 1 Teacher .
## 2 Teacher .
## 3 Teacher .
## 4 Student .
## 5 Teacher !
## 6 Teacher ?
## .
## .
## .