2011-11-07 20 views
0

あなたのお時間をいただき、ありがとうございます。XPathで情報を入力してください

私はいくつかのウェブから情報を選びたいと思っています。そのような表現には問題があります。

  <a class="xxxxx"> 
      <br> 
      Hi 
      <br> 
      <span class="hpn">City</span> 
      : Barcelona 
      <br> 
      <span class="hpn">color</span> 
      : Blue 
      <br> 
      <span class="hpn">Price</span> 
      : 50 
      <br> 

私はあなたの答えを待って、結果バルセロナ、ブルーと50

イムを街の色と価格の情報をピックアップしたいです!

+1

これまでに試したことをお見せします。 –

+0

Xpathを使用する理由は何ですか?情報を抽出するためにregexを使用しないでください。上記の例は実際にはXMLではなくHTMLです。 – tazyDevel

答えて

2

あなたのXpathの知識を含む他の情報がない場合、私はXpath tutorialにあなたを導きます。

0

上記のテキストはXMLではないので(XMLとしてタグ付けしていますが)、そのまま使用することはできません。上記の抽出は、<a>タグの終了タグを追加しない限り(これをコピーするのを忘れたとします)、<br>タグをすべて自動的に閉じて<br/>にする必要があります解析される。私はどの言語でこれを指定しようとしているのか分からないので、おそらくあなたのパーサは正常に動作しますが、XPathクエリの結果が残念です。しかし、それが動作すると仮定すると、

//a[@class='xxxxx']/span[text()='City']/following-sibling::text()[1] 

のようなクエリが返されます「:バルセロナ」(削除し、それをサブストリングに「:」を部分)

または

//a[@class='xxxxx']/span/following-sibling::text()[1] 

が返されます各スパンクラスの後の最初の兄弟

関連する問題