コンピューティングの類似度行列

-1

私は「クロス検証済み」フォーラムで、これまでのところ応答なしでも、この質問をしてきたので、私もここにしようとしています：私は類似度行列を計算したいコンピューティングの類似度行列

を（私はさらに私のデータ（自動車会社の失敗データ）からクラスタリング目的で使用されます。データは次の変数で構成されています：

開始日+時間（dd/mm/yyyy hh/mm/ss）、DURATION（秒）、DAY OF THE WEEK（月、火、...）、WORKING TEAM （1,2,3）、LOCALIZATION（1,2,3、...、20）、FAILURE TYPE

このことから、連続的かつ分類的なデータがあることは明らかです。障害タイプ間の類似点を計算するには、どのような方法をお勧めしますか？ユークリッド距離やゴウの類似点を使うことはできないと思う。前もって感謝します。

目的によって異なります。どのような目的のために類似性を定義したいですか？ – user31264

データ（クラスタークラスタリング）のクラスター分析を実行したいので –

**では5時間**ではなく、他の週に回答する必要があります。クロスポストしないで、クロスバリデーションはより良い場所でした。 –

いいえ、現実世界でのデータの意味に関するあなたの知識を表す特別な機能が必要です。おそらく、主に連続差分に重みを適用し、離散カテゴリ変数に対しては2D単純行列を適用します。しかし、私たちの極端な値やファジィ化の検閲を支配しないでください。

2017-01-07 19:09:45

私はあなたが何を意味しているのか分かっていません:)あなたはもっと具体的になりますか？多分例が役立つでしょう。私は行列を計算したいので、階層的なクラスタリングを行い、失敗の種類間の関係を見つけることができます。 –

答えて