2011-01-14 11 views
0

私は情報テーブルを持っているhtmlファイルを持っており、特定の列を抽出しようとしています。パターンは「TableDarkRow」と「TableLightRow」を交互にこのようなものです:正規表現を使用してファイルから情報を抽出し、ヘルプが必要

'>817338284254611</A></td><td Class='TableDarkRow' NOWRAP> 01/14/2011</td> 

そして、私は数と日付のペアの配列を抽出しようとしている:

817338284254611 
01/14/2011 

私が試したと思い付きましたこの:

>([0-9])+</A>(.*)NOWRAP> ?([0-9]{2}\/[0-9]{2}\/[0-9]{4}) 

しかし(.*)は、文書全体が最初と最後のオカレンスの間で選択することが可能です。非貪欲マッチングのため.*?.*を交換し

/[0-9\/ ]+/ 

答えて

1

+0

これはやっているようです。ありがとう! – user77413

0

あなたは `[A-ZA-Z '<> \ T] +' で.*を置き換えることができます。

関連する問題