2016-10-12 1 views
0

timeseriesクラスタリングタスクを実行します。 4つのデータ(t1〜t4)があるとします。ここで動的タイムワーピングと正規化

t1={1,1,1,1,1,1,1} 

t2={10,10,10,10,10,10,10} 

t3={100,100,100,100,100,100,100} 

t4 = {1,5,9,13,17,21,25} 

、この例の背後に私の意図は、その形状が一定ラインであるので、私は、一緒にグループT1、T2、T3にしたいということです。しかし、t4は昇順のように見えますので、他のグループにいるはずです。

しかし、私はt1とDTW(のpython mlpyパッケージ)を使用して、他の人の間の距離を計算する場合は、次のように私はなりました:

t1-t1: 0 (absolutely) 

t1-t2: 63 

t1-t3: 693 

t1-t4: 84 

私たちが見ることができるように、T1〜T3間の距離がよりはるかに大きいですそれはt1〜t4の間です。 これは、t3の振幅のスケールが他のものよりずっと大きいためです。

この状況では、DTWを適合させる前に、各timeseriesデータに対してmin-max正規化(つまり、0〜1正規化)を使用するのがよいでしょうか? つまり、t1、t2、t3を{0,0,0,0,0,0,0}とし、t4を{0,017、...、1}とする。 その後、DTWは結果を返します。

まもなく、私はDTWの前に正規化タスクの適性を疑問に思います。 私はDTWの初心者ですが、基本的な質問であなたを気にして申し訳ありません! :)

答えて

1

いいえ、z正規化を行う必要があります。

ゼロ・ワン正規化は、単一の外れ値に非常に敏感である

ソースhttp://www.cs.unm.edu/~mueen/DTW.pdf

+0

は良い材料のために、ありがとうございます。正規化方法をmin-max正規化からZ正規化に変更します。 –