Regex：section contains

 = BlaBla = = = false = 

だけ提供あなたの例のテストケースに基づいて、あなたは簡単な正規で逃げることができるかもしれません

<font[^>]*color="[^"]+"[^>]*>

デモ：http://jpad.io/example/1u/36573959-example

ただし、コメントで指摘されているように、正規表現は一般にHTMLの処理には適していません。

出典

2016-04-12 13:05:42 mellamokb

HTMLを解析するには、JSOUPとするのがよいでしょう。簡単な紹介はcookbookで始まります。正規表現次

出典

2016-04-12 13:07:17 1ac0

試してみてください。

(?<=\<)(\w+)[^<]*color.*?\>

デモ：

String data = "<font color=\"black\">"; 
String strFind = "color"; 

Pattern regex = Pattern.compile("(?<=<)(\\w+)[^<]*"+strFind+".*?>", Pattern.MULTILINE); 

Matcher matcher = regex.matcher(data); 
while (matcher.find()) { 
    String content = matcher.group(1) == null ? matcher.group() : matcher.group(1); 
    System.out.println(content); 
}

提供されているサンプルテキストは、それが目的の文字列を含むタグの名前を表示します。この場合はfont

出典

2016-04-12 13:08:40 Saleem

これは正規表現で処理できますが、これは危険です。

一方、JSOUPはそのユースケースを想定しており、非常に使いやすいものです。

例：

public static void main(String[] argv) throws Exception { 
    Document document = Jsoup.parse("<font id=\"myFont\" color=\"black\">"); 
    Elements font = document.select("font"); 
    for (Element element : font) { 
    System.out.println(element.attr("color")); 
    } 

}

出力：あなたは色の値を取得したい

black

出典

2016-04-12 13:13:14

Regex：section contains

答えて

関連する問題