追跡期間の異なるさまざまなハッシュタグのTwitterツイートを取得しました。たとえば、hashtag1は6日間追跡され、Hashtag2は4日間追跡され、Hashtag3は2日間追跡されました。どうすれば各ハッシュタグを正規化できますか?どうやってそれらを等分することができますか?事前のおかげで...ここにコードがある......>R言語を使ってヒストグラムのつぶやきを正規化する方法は?
library(streamR)
library(rjson)
setwd("/Users/Desktop")
Tweets = parseTweets("Hashtag1.json")
table(Tweets$created_at)
dated_Tweets <- as.POSIXct(Tweets$created_at, format = "%a %b %d %H:%M:%S
+0000 %Y")
hist(dated_Tweets, breaks="hours", freq=TRUE, xlab="dated_Tweets", main=
"Distribution of tweets", col="blue")
あなたが今得るか何を私たちに示し、そして正確にあなたがして満足していないかを説明することはできますか?ハッシュタグごとに1日あたり_tweetsのようなものが欲しいですか? –
はい各ハッシュタグのヒストグラムを視覚化しましたが、各ハッシュタグの追跡期間が異なりますので、各ハッシュタグを正規化します。たとえば、24時間の各日を4四半期(6時間ごと)に分けて、すべての日を同じヒストグラムにまとめます。 – user3643380
だから、あなたはツイートタイムスタンプを持っています。あなたは、各ツイートのための "日の四半期"のヒストグラムを作成したいですか?あなたは#2がtweetedされているか、朝の時間に、そして#4が夜になっているかを見たいと思っていますか? –