時系列データの異常検出には手間がかかります。私は異常検出のコードを持っていますが、データの準備をしようとしています。データは以下の通りです。異常検出のためのデータの準備
timestampUtc
2016-08-01 14:38:01, 2016-08-01 14:38:06, 2016-08-01 14:38:12, 2016-08-01 14:38:18, 2016-08-01 14:38:22, 2016-08-01 14:38:27, 2016-08-01 14:38:27, 2016-08-01 14:38:30, 2016-08-01 14:38:37, 2016-08-01 14:38:38, 2016-08-01 14:38:38, 2016-08-01 14:38:46, 2016-08-01 14:39:03, 2016-08-01 14:39:03, 2016-08-01 14:39:10, 2016-08-01 14:39:12, 2016-08-01 14:39:15, 2016-08-01 14:39:16, 2016-08-01 14:39:20, 2016-08-01 14:39:28
最初に、timestampUtc
の欄に秒をゼロにしたいとします。次に、count
という列を作成し、その特定の分の値の数を数えたいと思います。たとえば、出力は次のようになります。
timestampUtc count
2016-08-01 14:38:00 12, 2016-08-01 14:39:00 6, 2016-08-01 14:40:00 8
私はあなたがちょうど使用した場合、あなたの束の合計を避けることができたと思う: 'df < - aggregate(count〜timestamp、data = df、FUN = length)' –