2010-11-26 22 views

答えて

4

Railsには既に強力なものが含まれていますsanitization helpers

string = '<span id="span_is"><br><br><u><i>Hi</i></u></span>' 
strip_tags(string) 
+0

これはかなり良いですが、多くの " " – AnApprentice

1

それはあなたのHTMLがどのように複雑に依存しますが、あなたは確かにあなたがHTMLからテキストを照会するNokogiriXPathのを使用することができます。どのくらい解析したいか、それを行う余分なライブラリを正当化するかどうかによって異なります。

0

パーザはこれを行うことはできますが、提示するHTMLが単純な場合は余計です。 Loofahsanitizeのようなものは、Nokogiriを使ってすべてのタグを取り除いてHTMLを解析し、タグを取り除いてテキストを残すことができます。

require 'sanitize' 

html = '<html><body>Jackdaws love my giant sphinx of quartz.</body></html>' 
puts Sanitize.clean(html) 
# >> Jackdaws love my giant sphinx of quartz. 

私はヘチマがサニタイズよりも可能だと思いますが、あなたがしたいすべてのタグを離れて投げるされている場合サニタイズを移動するための方法かもしれません。

関連する問題