2011-12-21 10 views
2

私の目的は、2つのテキストから似たフレーズを見つけることです。2つのテキスト間で一致するフレーズを検索しますか?

私はよくある言葉が問題になることを知っています。たとえば、and thewe are theです。その場合、フィルターが必要になると思います。

これは良いアプローチであるかどうかを知りたいですか?これは再帰を使用します。一致するものが見つかった場合は、次の単語も一致するかどうかを確認し、一致がなくなるまで続けます。

1. the cat is on the roof 
    2. a man is on the stage 

    A1 = [the, cat, is, on, the, roof] 
    A2 = [a, man, is, on, the, stage] 

    [the]: no match 
    [cat]: no match 
    [is]: match 
    [is, on]: match 
    [is, on, the]: match 
    [is, on, the, roof]: no match 
    [on]: match 
    [on, the]: match 
    [on, the, roof]: no match 
    [the]: match 
    [the, roof]: no match 
    [roof]: no match 
    -end- 
+0

あなたはアプローチにアドバイスしたいと思いますが、アプローチがうまくいくとコードを表示できますか? – RageZ

答えて

3

Googleでクイック検索はthis websiteはあなたの問題を解決を含む私を示した:

それは両方の 文字列への一般的な単語の最長のシーケンスを見つけること、そして再帰的に最長のシーケンスを見つけることによって動作します部分文字列が共通の単語を持たないようになるまで、文字列の残りの部分は です。 この時点で、残りの新しい単語を挿入として追加し、残りの古い単語を削除として追加します。

関連する問題