2011-11-10 12 views
0

pls help me。Javaの正規表現

この文字列値を分割するにはどうすればよいですか?

文句を言わない作業以下の私のコード:

String[] tempStr; 

toSplit = "This is the just a sample <FONT COLOR=BLACK>1)[option1/option2]</FONT> sentence. This is another sample <FONT COLOR=BLUE>1)[othertext1/othertext2]</FONT> sentence." 

tempStr = toSplit.split("<FONT COLOR = [A-Z]*>([.])*</FONT>"); 

私は男が区切り文字で段落を分割する....任意の助けに感謝している何をしたいです。

+0

は、「BLACK」または「BLUE」のフォント色ですか? – Naved

+0

私の質問が更新されました。ソリ。 – jayellos

+0

正確には動作しません。それはコンパイルされませんか、または予期しない結果を返しますか?コンパイラのエラーメッセージとは何ですか?また、実行時に返されるものは何ですか? – jmg

答えて

4

分割の仕方によって異なります。あなたは配列要素としてテキスト断片を抽出し、すべてのHTMLタグを削除する必要がある場合は、次のような何かを言うことができます。

tempStr = toSplit.split("<FONT.*?</FONT>");

は注意を払ってください。私はFONTタグのすべての属性を書きません。ここでは必要ありません。私の表現は簡単でスペースや引用符などを気にする必要はありません。

しかし、この正規表現では大文字と小文字が区別されます。 Patternによってサポートされているさまざまなフラグをより柔軟に使用できるようにするには、Matcherを作成してsplit()メソッドを使用します。

あなたの解析がより複雑な場合は、「本物の」HTMLパーサーを使用することをお勧めします。

+0

ありがとうalexR、これは私が必要とするものです。 – jayellos