15
など。 Soundexアルゴリズムは英語に最適化されています。大規模な言語ファミリに適用されるより普遍的なアルゴリズムはありますか?国際的なSoundexを作るには?
など。 Soundexアルゴリズムは英語に最適化されています。大規模な言語ファミリに適用されるより普遍的なアルゴリズムはありますか?国際的なSoundexを作るには?
SOUNDEXは確かに英語指向です。より多様な発音上の違いを考慮する2つのものは、Double MetaphoneとNYSIISです。
これらは、SOUNDEXよりもはるかに大きな領域にエンコードを生成します。ダブルメタフォンは、具体的には、英語よりも多くの言語に基づく代替発音を扱うという明示的な目的での削減を含みます。
私は最近ファジーストリングマッチングに関するプレゼンテーションを行いました。the slidesが役に立ちます。あなたのスライドへのリンクが壊れている
(404) –
@ジョンは:新しいリンクは – Hace
感謝をhttp://asymmetrical-view.com/talks/#fuzzy-string-matchingしているようだ、私はちょうどを指すように更新関連するgithubリポジトリのPDF - 私はそれがより一定に保たれることを願っています。ありがとう。 –