1
VISHWANATHAN KRISHNA GURUVAYUR
およびGURUVAYUR KRISHNA VISHWANATHAN
と似たRの名前と一致させようとしています。スペースを削除した後levenshtein
は21%
に一致します。 私は似たように、これらの2人の名前をタグ付けすることができ、いくつかの文字列照合アルゴリズムがあるかどうかを知りたい...Rの文字が突発した名前の文字列一致
library(RecordLinkage)
levenshteinSim("GURUVAYURKRISHNAVISHWANATHAN","VISHWANATHANKRISHNAGURUVAYUR")
#[1] 0.2142857
連結する前に3つの単語を同じ順序で並べますか? – cory
テーブルには何百万ものレコードがあり、単語の順序は定義されていません。それは代わりに 'GURUVAYUR VISHWANATHAN KRISHNA'または' KRISHNA GURUVAYUR VISHWANATHAN' .. – Oshan
なぜあなたは "abcdef"と "efabcd"の間のlevenshtein距離を1にしますか? – cory