データフレームdf
には「メッセージ」が含まれています。各行はメッセージです。各メッセージにはdf$messagedate
というタイムスタンプがPOSIXct形式の%Y-%m-%d %H:%M:%S
にあります。例:Rを使用して、すべてのイベントとそのタイムスタンプを含むデータフレームから1日あたりの合計イベントを計算します。
> head(df)
messageid user.id message.date
123 999 2011-07-17 17:54:27
456 888 2011-07-19 16:56:50
(ここでは上記のdput()
」EDバージョンがある):
df <- structure(list(messageid = c(123L, 456L), user.id = c(999L, 888L),
message.date = structure(c(1310950467, 1311119810), class = c("POSIXct",
"POSIXt"), tzone = "")), .Names = c("messageid", "user.id",
"message.date"), row.names = c(NA, -2L), class = "data.frame")
がどのように私は一日あたりのメッセージ数、合計でデータフレームを作成するのですか?例:メッセージなしで日付を含む
day message.count
2011-07-17 1
2011-07-18 0
2011-07-19 1
よりもむしろない、私はmessage.count
がそれらの日のためにゼロに設定されていることを確認します。
私がこれまで行っている:私は実行してmessage.date
のカレンダーの日の部分を抽出しています
df$calendar.day<-as.POSIXct(strptime(substr(df$message.date,1,10),"%Y-%m-%d",tz="CST6CDT"))
> head(df$calendar.day)
[1] "2011-07-17 CDT" "2011-07-18 CDT" "2011-07-19 CDT"
そして、そこから私は、日付範囲のすべての単一のカレンダー日付のリストを生成することができます: 日付範囲を< - seq(min(df $ calendar.day)、max(df $ calendar.day)、by = "day")
あなたは 'dput(DF)'(またはおそらくdput(DF使用している場合は、[1:5])、あなたは私たちが –