2009-05-03 65 views
3

私はおおよその文字列一致のフィールドを初めて使用しています。Bitapアルゴリズムの検索パターンの長さを克服する

私はBitap algorithmの用途を模索していますが、これまでのパターンの長さには問題があります。私はFlashで作業していますが、32ビットの符号なし整数とIEEE-754倍精度浮動小数点数型を処分しています。整数型の場合、最大53ビットを割り当てることができます。それでも、私はむしろ50文字よりも長いパターンを扱うことができるファジーマッチングアルゴリズムを持っています。

BitapアルゴリズムのWikipedia pageには、アルゴリズムの無制限パターン長の実装を示していると思われるlibbitapが記述されていますが、そのソースからアイデアを得るのは難しいです。

無限長のパターン、または干し草の推奨場所の近くで針のファジーストリングマッチングを実行できる別のアルゴリズムについて、Bitapを一般化する方法について提案はありますか?

答えて

2

google codeには、このアルゴリズムのかなり奇妙な実装があります。 試してみてください。私はファジーマッチの正確な場所(テキストの開始点と終了点)を取得する方法を理解することはできません。開始点と終了点の両方を取得する方法が分かっている場合は、共有してください。

+0

これは私が始めたところです。彼らは無制限の長さの実装を使用するのではなく、いくつかの検索を実行することによって制限された長さの問題を回避します。 – Hristo

関連する問題