1

私は機械学習が初めてで、1年間にわたって100人のセットの非常に大きなデータセットを持っています。目標はランチタイムに基づいて誰がバディーズであるかを知ることです。特定のイベントの期間を指定して人をクラスタ化/グループ化するにはどうすればよいですか?

私は、次のデータセットがあります。

Person StartTime EndTime Duration(dif for start and end times) 
Person1 Time11 Time12 diff1 
Person2 Time21 Time22 diff2 
Person3 Time31 Time22 diff3 
Person4 Time41 Time32 diff4 

今私は人の場合は開始時間と終了時間を意味+/- 5分の時間差と一緒に自分の時間に基づいて/グループの人々を(クラスタしたいと思いますが1は12:00 - 1:00 PMで、人2は11:55 - 1:05です。人1と同じグループに属します)

何か助けていただければ幸いです。

+0

特定の言語で表示されますか?あなたのデータはどのフォーマットですか? – benten

+0

こんにちは、言語は重要ですか?その人の名前と開始時刻(日付付き)と終了時刻(日付付き)、ありがとう! –

+0

私はあなたが特定の言語でプログラミングしているのですか?あなたは無関心ですか? – benten

答えて

0

これに基づいてグラフを作成します。エッジの重さはランチタイムの重なりです。昼食時間、昼食を取った人の数、そしてlog(1 + duration)のような非線形重み付けを追加することもできます。

結果のグラフで、コミュニティ検出アルゴリズムを実行します。

関連する問題