x秒よりも長く発生するトークンペアを見つけようとしています。多くの大きなXMLファイルを解析する - 一致するトークンがx秒以上離れて出力されたときに出力する
XMLデータは次のようになります。
<entry stamp="2017-10-30T19:19:59" level="MESSAGE" location="Process" message="token is 191"/>
<entry stamp="2017-10-30T19:20:59" level="MESSAGE" location="Process" message="token is 192"/>
<entry stamp="2017-10-30T19:21:59" level="MESSAGE" location="Process" message="token is 193"/>
<entry stamp="2017-10-30T19:22:59" level="MESSAGE" location="Process" message="token is 194"/>
<entry stamp="2017-10-30T19:23:59" level="MESSAGE" location="Process" message="token is 191"/>
<entry stamp="2017-10-30T19:24:59" level="MESSAGE" location="Process" message="token is 192"/>
<entry stamp="2017-10-30T19:25:59" level="MESSAGE" location="Process" message="token is 193"/>
<entry stamp="2017-10-30T19:25:59" level="MESSAGE" location="Process" message="token is 194"/>
実際のメッセージは非常に長いです。それはそれぞれにトークンを持っています。
一意のINトークンを持つ行があり、それに対応するOUTトークンがあります。
通常、INトークンとOUTトークンは互いに1秒以内に発生します。
これらのファイルはHUGE - 100MBであり、数百もあります。
x秒以上離れて発生する外れ値はわずかです。
これらの行が存在する場合は、ファイルに追加します。
どのような考えですか?私はxmlstarletを使用していますが、RHELでそのアイデアを把握して実行することができれば、基本的には何もできます。
_ "一意のINトークンを持つ行があり、それに対応するOUTトークンがあります。" _ _これはあなたが示したXMLにどのように関係していますか?ヘルプが必要な場合は、関連するすべての情報とデータを表示する必要があります。 –
私は、 '@ message'を持つ最初の' '要素がINトークンとして解釈され、同じ' @ message'を持つ2番目の ''要素が対応するOUTトークンとして解釈されると思います。しかし、私は完全に間違っているかもしれません、説明は確かに明確ではありません。 –
RHEL = Red Hat Enterprise Linuxを探すために誰かを救うために。 –