2016-11-16 8 views
-2

{abb、abgt、acctg、tgbs、abs}のような文字列のリストがあります。文字列の数はユーザーによって定義されます。私は同じ長さの紐をまとめる必要があります。どのクラスタリングアルゴリズムがそのような場合に適しているのか、その理由は何ですか?私が知る限り、K-手段は、文字列の数があらかじめ定義されていないため、手前でクラスターの数を知る必要があります。長さに基づいたクラスタリング文字列

+1

あなたは長さ(str)でグループ化することができます。クラスタリングは本当に必要ありません。 –

答えて

0

文字列を繰り返します。文字列の長さをキーとして使用するint - >文字列のマップに格納します。完了しました。

これはクラスタリングではありません。技術的には、単純なGROUP BY操作です。 SQLでは、GROUP BY LENGTH(col)を実行します。

k-meansは完全に間違った選択です。

+0

:いただきありがとうございました。 – Ivy

関連する問題