2011-05-14 4 views
1

私はjtidyパーサを使ってWebページを解析しています。それは<title>...</title>のために正常に動作して読んで問題がありますタグwebのWebページから

InputStream in=new URL("http://www.medicinenet.com/alopecia_areata/article.htm").openStream(); 
Document doc= new Tidy().parseDOM(in, null); 
String titleText=doc.getElementsByTagName("title").item(0).getFirstChild().getNodeValue(); 

が、私は渡されたURLは、それが大文字でタイトルタグ<TITLE>...</TITLE>が含まれています。一種の、働いています。だからそれはnullを返す。

閲覧方法<TITLE>...</TITLE> & <title>...</title> Javaコードを使用して1つのステートメントで?私を助けてください。

答えて

1

ちょうどその大文字

String titleText=doc.getElementsByTagName("title").item(0).getFirstChild().getNodeValue(); 
if (titleText == null) titleText=doc.getElementsByTagName("TITLE").item(0).getFirstChild().getNodeValue(); 

getElementsByTagNameをチェックすると、大文字と小文字が区別されるので、これが最も簡単なオプションである、ヌルをチェック。 「(

+0

は、私は上記のコードを試みたが、これは、あなたが言ったように私はこのコードを試してみました – DJ31

+0

--->もし(のTitleText == nullの)のTitleText = doc.getElementsByTagNameで私を助けてください、機能していませんTITLE ")。item(0).getFirstChild()。getNodeValue(); - 例外をスローしていますが、再びnullを返しています。 – Codemwnci

+0

をどのように働いていない別の解決策 – DJ31

関連する問題