正規表現とリストの結果をまとめることができません

これはあまりにも一般的な質問のように私は正規表現にはかなり新しいです。正規表現とリストの結果をまとめることができません

シナリオ：

私は、私は特定のパターンを単離したしたファイルのセットを持っている[mainpattern]と言います。このパターンのそれぞれの発生において、[mainpattern]の前には、その前に右矢印が付いた様々な[subpattern] occurencesが続きます。

cat * .txt | grepの "mainpattern"

... [>] [subpattern1] [。] [mainpattern] ...

... [>] [subpattern2] [。] [mainpattern] ...

...

... [>] [subpatternN] [。] [mainpattern] ...私は基本的にすべてのサブパターンが一意に列挙されている出力（無重複を生成しようとしています

）。何か案は？私は "grep出力から先にワードをコード化する方法を理解できませんでした"。

感謝

2016-10-31 pescator

は猫 '試してみてください：uniqのリストについては次のようなsortとuniqを追加するだけですgrep -oP '（？<= [。]）サブパターン（？= [。]メインパターン）' 'ですが、重複した問題を解決するかどうかはわかりません。 –

ちょうど試してみましたが（動作しません）、私は[mainpattern]部分を知っているという事実について具体的に考えるべきですが、[サブパターン]は常にランダムで不明です*先験*これらのランダムに生成されたシーケンスをリストすることです。 – pescator

だから、 'サブパターン（subpattern）はドットだけであることが分かりますか？ ''（？<= [。]）[^。] *（？= [。]メインパターン） '' –

あなたは-oPオプション（PCREと出力一致モード用o用P）でPCREスタイルの正規表現(?<=>)[^>.]*(?=[.]mainpattern)を使用することがあります。パターンが一致した

grep -oP '(?<=>)[^>.]*(?=[.]mainpattern)'

：

2016-10-31 13:00:56

@WiktorStribiżewは正規表現を使用することができます。 | * .txtの

pcregrep -o '(?<=>).*?(?=\.mainpattern)' *.txt | sort | uniq

2016-11-01 16:45:49

答えて