2008-09-24 9 views
15

など。 Soundexアルゴリズムは英語に最適化されています。大規模な言語ファミリに適用されるより普遍的なアルゴリズムはありますか?国際的なSoundexを作るには?

答えて

11

SOUNDEXは確かに英語指向です。より多様な発音上の違いを考慮する2つのものは、Double MetaphoneNYSIISです。

これらは、SOUNDEXよりもはるかに大きな領域にエンコードを生成します。ダブルメタフォンは、具体的には、英語よりも多くの言語に基づく代替発音を扱うという明示的な目的での削減を含みます。

私は最近ファジーストリングマッチングに関するプレゼンテーションを行いました。the slidesが役に立ちます。あなたのスライドへのリンクが壊れている

+1

(404) –

+2

@ジョンは:新しいリンクは – Hace

+1

感謝をhttp://asymmetrical-view.com/talks/#fuzzy-string-matchingしているようだ、私はちょうどを指すように更新関連するgithubリポジトリのPDF - 私はそれがより一定に保たれることを願っています。ありがとう。 –

関連する問題