可能な場合は、各ペアの同じ部分文字列(下の例では太字のテキスト、強調するために太字/大文字のみを使用しています)に一致する2組の文字列がありますそれぞれのリスト内でユニークなリスト要素を調べることによってキー部分文字列を特定する)。テキストの残りの部分(lorem ipsum)は、多くの要素に共通する場合もあれば、完全に一意である場合もあります。ユニークな部分文字列に基づくペア文字列
リスト1:
- "Loremのイプサム嘆き座るAMET、CANDY BAR consecteturのadipisicing ELIT、"
- "SEDはincididunt UT tempor eiusmod CANDYのCANEを行うlaboreらdolore マグナ"
- "eedod eiusmod tempor HOMER incididunt ut labo et dolore magna"
- "Loremのイプサム嘆き、AMET consecteturのadipisicing PICKUP TRUCK ELIT座る"
- 「ullamcoのlaborisのNiSi UT aliquipの元のEA commodoのconsequat。 Duisのaute "
リスト2:
- は、 "SEDはeiusmod"
- " laboreらdoloreマグナaliquaをincididunt HOMER UTをtemporありません。 キャンディーバー quis nostrud exercitation "
- " aliqua。ユタenim広告ミニムveniam、nostrud CANDYのCANEをQUIS exercitation」
- "irure悲しみでreprehenderitでvoluptate velit ESSE cillum dolore"
- "Loremのイプサム悲しみは "、AMET consecteturのadipisicing ピックアップトラック ELIT座ります試合以下のサンプルテキストから
です:1-2; 2-3; 3-1; 4-5
リスト1の要素5とリスト2の要素4何も一致しない
。
私たちは部分文字列をどのように抽出できますか?私たちは、それぞれの一意の部分文字列は大文字か何かを知っていますか? – Juvanis
なぜ「時間」は2-1の解決策としてマークされていませんか?質問の数学的な定義はありますか? – mgaert
@mgaertの時間は一意ではありません。これはリスト1の2行目と3行目の両方にあります。 –