パターンが文字列であるクラスタリングソフトウェアがあります。 文字列は、最も長い共通部分シーケンスを使用して類似性によってグループ化されます。 このクラスターの2次元プロットを作ることは可能ですか?どのようにしてxy軸上の文字列を表現できますか?は2Dプロットの文字列を表します
私が唯一のアイデアは、例えば、文字列から整数を有するためにASCIIコードを使用することである:R = 114、E = 101 D = 100
これそれの1D becouse 315 = 赤表現!
p.s.ソフトウェアはJavaですが、プロットデータの場合は通常Matlabを使用します
もし可能であれば、私は2Dのプロットにポイントを見たいと思っています。例: 単語 "誘導"を表すポイントは、単語 "侵入"のポイントの近くにあります。問題は、2次元空間でどのように「誘導」を表現するかです。 – tulkas85
MDSのように、私が上記で示したポインタを見てください。それは距離を保存するためのもので、Levenshtein距離で初期化することができます。 –