正規表現を解析する2種類のデータを持つファイルがあります。しかし、データは十分に類似しているため、私はそれを区別する正しい方法を見つけることができません。私のファイルにPythonの正規表現に似た式
一部の行の形式は次のとおりです。
AED=FRI
AFN=FRI:SAT
AMD=SUN:SAT
他の行は、フォーム
AED=20180823
AMD=20150914
AMD=20150921
である残りの行はヘッダであり、私はそれらを破棄したいと思います。例えば
[HEADER: BUSINESS DATE=20160831]
私のソリューションの試みはこれまでのところ、最初の3つの大文字と等号を一致させることです
r'\b[A-Z]{3}=\b'
が、その後、私は、日付(例えば20180823)を区別するかどうかはわかりません日(例:金曜日:土曜日:日曜日)。私はこれらの解析機能から期待
結果:
Regex weekday_rx = new Regex(<EXPRESSION FOR TYPES LIKE AED=FRI>);
Regex date_rx = new Regex(<EXPRESSION FOR TYPES LIKE AED=20160816>);
weekdays = [weekday_rx.Match(line) for line in infile.read()]
dates = [date_rx.Match(line) for line in infile.read()]
あなたはどんな結果が期待できますか? –
ああ、確信してください –
また、複数行の文字列(ファイル全体)を処理しているのか、行単位で読み込んでいますか? –