2016-12-18 5 views
0

スパンタグの不要な "& nbsp"文字を除いたテキストを選択するにはどうすればよいですか?私は数字だけを必要とします(終わりのユーロ文字はいいですが、それは必須ではありません)。数字は変わりますが、それらは同じではありません。あなたは、あなたがC#の文字列として、あなたのXPath式を記述すると仮定すると、C#とXPathを使用している場合XPath、ユーロ記号の不要な文字を削除するには?

<span class="price">15.900&nbsp;€</span> 
+0

であるXMLまたはHTMLですか? – spender

+0

text = text.Replace( " "、 ""); –

+0

HTML、私はwebscrapingを練習しています。 – CsharpNoob

答えて

1

あなたは"translate(//span[@class = 'price'], '\u00A0', '')"を使用することができます。

(JavaScriptで)ワーキングサンプルが

console.log(document.evaluate("translate(//span[@class = 'price'], '\u00A0', '')", document, null, XPathResult.ANY_TYPE, null).stringValue);
<span class="price">15.900&nbsp;€</span>

+0

あなたは/ u00A0、 ''の部分を詳しく説明できますか? – CsharpNoob

+0

また、ドキュメントhttps://msdn.microsoft.com/en-us/library/ms228362.aspx#String%20Escape%20SequencesのUnicodeエスケープシーケンスを参照してください。それは '/ u00A0'ではなく' \ u00A0'です。 –

+0

そしてHTMLでは、エンティティ参照 'nbsp;はJavascriptやC#の文字列リテラルで' \ u00A0'としてエスケープできるUnicode文字U00A0を書くHTMLの方法です。 –

関連する問題