スパンタグの不要な "& nbsp"文字を除いたテキストを選択するにはどうすればよいですか?私は数字だけを必要とします(終わりのユーロ文字はいいですが、それは必須ではありません)。数字は変わりますが、それらは同じではありません。あなたは、あなたがC#の文字列として、あなたのXPath式を記述すると仮定すると、C#とXPathを使用している場合XPath、ユーロ記号の不要な文字を削除するには?
<span class="price">15.900 €</span>
スパンタグの不要な "& nbsp"文字を除いたテキストを選択するにはどうすればよいですか?私は数字だけを必要とします(終わりのユーロ文字はいいですが、それは必須ではありません)。数字は変わりますが、それらは同じではありません。あなたは、あなたがC#の文字列として、あなたのXPath式を記述すると仮定すると、C#とXPathを使用している場合XPath、ユーロ記号の不要な文字を削除するには?
<span class="price">15.900 €</span>
あなたは"translate(//span[@class = 'price'], '\u00A0', '')"
を使用することができます。
(JavaScriptで)ワーキングサンプルが
console.log(document.evaluate("translate(//span[@class = 'price'], '\u00A0', '')", document, null, XPathResult.ANY_TYPE, null).stringValue);
<span class="price">15.900 €</span>
あなたは/ u00A0、 ''の部分を詳しく説明できますか? – CsharpNoob
また、ドキュメントhttps://msdn.microsoft.com/en-us/library/ms228362.aspx#String%20Escape%20SequencesのUnicodeエスケープシーケンスを参照してください。それは '/ u00A0'ではなく' \ u00A0'です。 –
そしてHTMLでは、エンティティ参照 'nbsp;はJavascriptやC#の文字列リテラルで' \ u00A0'としてエスケープできるUnicode文字U00A0を書くHTMLの方法です。 –
であるXMLまたはHTMLですか? – spender
text = text.Replace( " "、 ""); –
HTML、私はwebscrapingを練習しています。 – CsharpNoob