私はRがとても新しいので、やさしくしてください。NAをNに置き換えるコードを完成させる方法R
私はRに入って仕事をしてくれるKaggle Titanicコンペで仕事をしています。
私は自分のやり方で機能を設計しています。私は次に何をすべきかの論理にちょっと固執しています。
だから、ここに行きます。私の目標は年齢データを取ってNAのすべてを人物のタイトルの年齢中央値に置き換えることです。例えばその人がマスターであれば、すべてのマスターのメジアンを取得し、NAをそのメジアンに置き換えたいと思います。 Mr.さんと同じように。
私は次のように自分自身にタイトルや年齢を含むdata.frameを作成するために管理している:
library(tibble)
data.combined <-
tibble(
data.combined.new.title = c(
"Mr.",
"Mrs.",
"Miss",
"Mrs.",
"Mr.",
"Mr.",
"Mr.",
"Master",
"Mrs."
),
data.combined.Age = c(22, 38, 26, 35, 35, NA, 54, 2, 27)
)
このリストで見ることができるようにと氏とNAが隣にあり彼の歳。そのNAをリストの他のすべてのMrの中央値に置き換えたいと思います。
私は以下のコードを使って、NAをデータセット全体の中央値に置き換えることができます。私はちょうど得ることはありません何
#Creates my data.frame
agedata <- data.frame(data.combined$new.title, data.combined$Age)
#replace NA with the mean of the whole data set
agedata$data.combined.Age[is.na(agedata$data.combined.Age)] <- median(agedata$data.combined.Age, na.rm = TRUE)
、私はタイトルのグループの中央値によってNAを置き換えるために、このコードに追加する方法です氏、マスター、夫人、ミス?
すべてのポインタが大きく受信されます。
私はこの時点でKaggleの予測に役立つかどうか、コードがどのように見えるかについてはあまり興味がありません。
Many Thanks in Advance。
最も簡単なのは 'na.aggregate'だと思いますすなわち、 (群れ)%> mutate(形質= na.aggregate(形質、FUN =中央値)) ' – akrun