2016-07-29 15 views
1

私はELKIを初めて使いました。すでにWekaでテストしてクラスタ化したデータセットの基本的なクラスタリングを行う必要があります。私は、「GUIバージョン」を使用していると私は、「マウス」のデータを分析チュートリアルを読んELKIサイト上を設定します。私はEMと私のデータセットをクラスタ化し、成功したチュートリアルから(結果を可視化して出力階層型クラスタリングのためのELKI GUIクラスタリングの結果がありません

http://elki.dbs.ifi.lmu.de/wiki/Tutorial#Analyzingthemousedataset IパラメーターresultHandler:ResultWriter)を変更しました。私がフォルダに持っている結果は、cluster.txt、cluster-evaluation.txt、およびsettings.txtです。

階層アルゴリズム(SLINK、CLINKなど)の出力結果に問題があります。私が得た出力はsettings.txtだけですが、cluster.txtが必要です。

ログビューにエラーがないため、他のパラメータを変更する必要がありますか?階層的クラスタリング結果からパーティションを取得するには

+0

*あなたは*パーティションを抽出しましたか?または*階層*のみを計算しますか?階層的なクラスタリングは** 2段階のプロセス**です(もしあなたがツリーではなく "クラスタ"を望むならば)、おそらく最初のステップだけでした。どのようなパラメータを使用しましたか? –

+0

@ Anony-Mousse私はすべてのデフォルト設定でCLINKアルゴリズムを計算するタスクを実行します。 メインビューに階層アルゴリズムまたはパラメータを設定するためのチュートリアルやガイドがありますか? 編集:抽出すると、抽出のオプションが異なる_evaluator_というパラメータがありますか? – dery143

+0

ELKIには、階層からフラットクラスタリング(期待どおり)を抽出するアルゴリズムがいくつかあります。私は名前を今は思い出しませんが、CLINKのすぐ隣にありますか?簡単なアプローチは、樹状図を閾値でカットすることですが、ELKIにはもっと複雑な方法もあります。 –

答えて

1

、あなたはまた、クラスタ抽出方法を指定する必要があります。私たちは今、 -algorithmのパラメータを持っている、と順序が重要である

-algorithm clustering.hierarchical.extraction.HDBSCANHierarchyExtraction 
-algorithm CLINK 
-hdbscan.minclsize 50 

注意を。抽出アルゴリズムには、実際の階層的クラスタリングを行うための「ネスト」アルゴリズム呼び出しがあります。長期的には

CLINK clustering result

、我々は(GUIの特に)オペレータベースのアプローチに移動したいです。コマンドラインでは、階層型クラスタリングを実行せずに抽出することはできないため、入れ子になった呼び出しはより安全です。

CLINKの場合、クラスタの品質はあまり良くありません(です)。データをシャッフルして複数回実行すると結果が異なります。また、AGNESやAnderbergに完全なリンケージを試してもらいたい。 AGNESは常にO(n^3)であり、Anderbergは通常O(n^2)であり(最悪の場合はO(n^3))、どちらもより良い結果を生み出す距離はCLINKとは異なります):

Complete-Link clustering with Anderberg algorithm

関連する問題