2016-04-19 27 views

答えて

0

後の作業では、デフォルトでminPts = 2 * dimを使用することを提案しています。

J. Sander、M. Ester、H.-P. Kriegel、およびX. Xu。 1998年
空間データベースにおける密度ベースのクラスタリング:
アルゴリズムGDBSCANとそのアプリケーション。

Data Mining and Knowledge Discovery 2、2(1998)、169-194。
http://dx.doi.org/10.1023/A:1009745219419

あなたが重複している場合は、大きい方の値を使用します。 は「Dは本当に点の集合であるならば我々の実験は、この値は、各ポイントは1回だけ発生データベースD、すなわちのためにうまく機能することを示しています。 "

数値が小さいほど、計算効率が向上します。したがって、minPtsを小さくしても小さすぎないようにしてください。

常にあなたの結果を調査してください。ダブルチェックをしないで使用しないでください。

1

「常にベスト」というものはありません。 IIRCは最初にその価値を試すことを提案した。時には他の値を試してはいけないということではありません。私は通常、分数= 10で始まります...

また、イプシロンを変える必要があります。おそらく、ミニプルよりもイプシロンを選択することが重要です。 2つのパラメータは独立していません。 minptsを増やすと、イプシロンを増やすには が必要な場合があります。

関連する問題