2012-03-21 16 views
0

1000インスタンスを含む5つのクラスのトレーニングデータセットを、たとえばk-meansを使用して5つのクラスタ(センター)にクラスタ化したとします。次に、テストデータセットで検証することによって混乱行列を作成しました。私はそれからROC曲線をプロットしたいと思いますが、どうすればそれが可能ですか?分類またはクラスタリングの結果からのROC曲線

答えて

2

ロック曲線は、True PositiveとFalse Positive Rateのトレードオフを示します。換言すれば

ROCグラフは、TP速度が Y軸上にプロットされていて、離散的な分類器を使用する場合FPレートが ROC Graphs: Notes and Practical Considerations for Researchers

X軸上にプロットされた2次元グラフでありますその分類器は、ROC空間内の単一点のみを生成する。通常、確率を生成する分類子が必要です。 TPおよびFPレートが変更されるように、クラシファイアでパラメータを変更します。その後、このポイントを使用してROC曲線を描きます。

あなたはk-meansを使用します。 K-手段は離散的にクラスタメンバーシップを与えます。ポイントはClusterAまたはClusterEに属します。したがって、k-meansからROC曲線を出力することは容易ではありません。 Lee and Fujita には、このためのアルゴリズムが記載されています。彼らの論文を見るべきです。しかしアルゴリズムはこのようなものです。

  1. k平均
  2. テストデータを用いて計算TPとFPを適用します。
  3. 1つのクラスタから2つ目のクラスタへのデータポイントのメンバーシップを変更します。
  4. 再びテストデータを使用してTPとFPを計算します。

あなたは、彼らがROCスペースでより多くのポイントを取得見たようおよびROC曲線を描くために、これらのポイントを使用し

+0

あなた「1つのクラスタから二番目のクラスタにデータポイントの変更メンバーシップ」はどうすればよいですか?ランダムにデータポイントを選択し、それをランダムなクラスタに割り当てるか、どうやって行うのですか? – shn

+0

論文によれば、彼らはクラスタメンバーシップがシフトしたときにポイントを選ぶが、k-は全体の目的関数があまり変わらないことを意味する。 –

関連する問題