共通ブロックの検索

テキスト（またはバイナリデータ）を含む2つのファイル（f1とf2）があります。
共通ブロックをすばやく見つける方法を教えてください。共通ブロックの検索

F1：ABC DEF
F2：XXABC XEF

出力：

共通ブロック： "EF" F1：2 長さ2 @ 0 @ F1に "ABC" とf2：
長さ4 8

2008-09-22 Burkhard

あなたはアイテム（ 'ABC'、次に 'DEF'）をグループ化しているようですが、共通部分は同じグループにあります。これは目的ですか？ –

ウィキペディアはtとの最長共通部分を見つけるためのいくつかのpseudocodeを持っていますデータのシーケンス。あなたの場合、他の共通部分文字列（すなわち、最大共通部分文字列）のプレフィックスではない、テーブルから共通部分文字列をすべて単純に抽出します。

2008-09-22 20:25:13

@ @ 5とf2これは、このような目的のための素晴らしいツールです。： http://sourceforge.net/projects/duplo/

2008-09-22 20:19:36 torial

オープンソースPMDプロジェクトには、このページに記載されているカットアンドペースト検出モジュールがあります（http://pmd.sourceforge.net/integrations.html）。

2008-09-23 00:29:59

答えて