2011-07-08 8 views
8

私はLevensteinDistanceを介して2つの文字列の間の類似性を計算することができます。結果は、ある文字列を別の文字列に変更するのに必要な変更の数です。結果が0〜1の範囲であれば、文字列間の類似性を識別しやすくなります。結果は、0の大きな類似性により近くなります。出来ますか?例以下はレーベンシュタイン距離 - コモンズラングAPIでコモンズラング3.0 API

私が使用しています:

public class TesteLevenstein { 

    public static void main(String[] args) {  

     int distance1 = StringUtils.getLevenshteinDistance("Boat", "Coat"); 
     int distance2 = StringUtils.getLevenshteinDistance("Remember", "Alamo"); 
     int distance3 = StringUtils.getLevenshteinDistance("Steve", "Stereo"); 

     System.out.println("distance(Boat, Coat): " + distance1); 
     System.out.println("distance(Remember, Alamo): " + distance2); 
     System.out.println("distance(Steve, Stereo): " + distance3);   

    } 
} 

感謝を!

答えて

11

ちょうどいくつかの番号で分けてください。質問は何番ですか?おそらく、指定された文字列の可能な最大距離。私はそれが長い文字列の長さだと思う(つまり、すべての文字が異なっていて、短い文字列に比べていくつか追加されている)。

+5

"おそらく_指定された文字列対の可能な最大距離_は正しい"です。 –

+0

ありがとう!私はMRABに言ったようにして、その割合を取った。 – Deb

関連する問題