テキスト(またはバイナリデータ)を含む2つのファイル(f1とf2)があります。
共通ブロックをすばやく見つける方法を教えてください。共通ブロックの検索
F1:ABC DEF
F2:XXABC XEF
出力:
共通ブロック: "EF" F1:2 長さ2 @ 0 @ F1に "ABC" とf2:
長さ4 8
テキスト(またはバイナリデータ)を含む2つのファイル(f1とf2)があります。
共通ブロックをすばやく見つける方法を教えてください。共通ブロックの検索
F1:ABC DEF
F2:XXABC XEF
出力:
共通ブロック: "EF" F1:2 長さ2 @ 0 @ F1に "ABC" とf2:
長さ4 8
ウィキペディアはtとの最長共通部分を見つけるためのいくつかのpseudocodeを持っていますデータのシーケンス。あなたの場合、他の共通部分文字列(すなわち、最大共通部分文字列)のプレフィックスではない、テーブルから共通部分文字列をすべて単純に抽出します。
@ @ 5とf2これは、このような目的のための素晴らしいツールです。: http://sourceforge.net/projects/duplo/
オープンソースPMDプロジェクトには、このページに記載されているカットアンドペースト検出モジュールがあります(http://pmd.sourceforge.net/integrations.html)。
あなたはアイテム( 'ABC'、次に 'DEF')をグループ化しているようですが、共通部分は同じグループにあります。これは目的ですか? –