-1

私は「クロス検証済み」フォーラムで、これまでのところ応答なしでも、この質問をしてきたので、私もここにしようとしています:私は類似度行列を計算したいコンピューティングの類似度行列

を(私はさらに私のデータ(自動車会社の失敗データ)からクラスタリング目的で使用されます。データは次の変数で構成されています:

開始日+時間(dd/mm/yyyy hh/mm/ss)、DURATION(秒)、DAY OF THE WEEK(月、火、...)、WORKING TEAM (1,2,3)、LOCALIZATION(1,2,3、...、20)、FAILURE TYPE

このことから、連続的かつ分類的なデータがあることは明らかです。障害タイプ間の類似点を計算するには、どのような方法をお勧めしますか?ユークリッド距離やゴウの類似点を使うことはできないと思う。前もって感謝します。

+0

目的によって異なります。どのような目的のために類似性を定義したいですか? – user31264

+0

データ(クラスタークラスタリング)のクラスター分析を実行したいので –

+0

**では5時間**ではなく、他の週に回答する必要があります。クロスポストしないで、クロスバリデーションはより良い場所でした。 –

答えて

0

いいえ、現実世界でのデータの意味に関するあなたの知識を表す特別な機能が必要です。おそらく、主に連続差分に重みを適用し、離散カテゴリ変数に対しては2D単純行列を適用します。しかし、私たちの極端な値やファジィ化の検閲を支配しないでください。

+0

私はあなたが何を意味しているのか分かっていません:)あなたはもっと具体的になりますか?多分例が役立つでしょう。私は行列を計算したいので、階層的なクラスタリングを行い、失敗の種類間の関係を見つけることができます。 –