これはあまりにも一般的な質問のように私は正規表現にはかなり新しいです。正規表現とリストの結果をまとめることができません
シナリオ:
私は、私は特定のパターンを単離したしたファイルのセットを持っている[mainpattern]と言います。このパターンのそれぞれの発生において、[mainpattern]の前には、その前に右矢印が付いた様々な[subpattern] occurencesが続きます。
cat * .txt | grepの "mainpattern"
... [>] [subpattern1] [。] [mainpattern] ...
... [>] [subpattern2] [。] [mainpattern] ...
...
... [>] [subpatternN] [。] [mainpattern] ...私は基本的にすべてのサブパターンが一意に列挙されている出力(無重複を生成しようとしています
)。何か案は?私は "grep出力から先にワードをコード化する方法を理解できませんでした"。
感謝
は猫 '試してみてください:uniqのリストについては 次のような
sort
とuniq
を追加するだけですgrep -oP '(?<= [。])サブパターン(?= [。]メインパターン)' 'ですが、重複した問題を解決するかどうかはわかりません。 –ちょうど試してみましたが(動作しません)、私は[mainpattern]部分を知っているという事実について具体的に考えるべきですが、[サブパターン]は常にランダムで不明です*先験*これらのランダムに生成されたシーケンスをリストすることです。 – pescator
だから、 'サブパターン(subpattern)はドットだけであることが分かりますか? ''(?<= [。])[^。] *(?= [。]メインパターン) '' –