タイトルによると、私はいくつかのDOM操作タスクを持っています。たとえば、私はしたい: - 青色を持つすべてのH1要素を見つける。 - サイズが12pxのすべてのテキストを検索します。 など -Ruby on RailsでDOMを操作する方法
Railsでどうすればいいですか?
は...ありがとう:)
更新を
私はこのペーパー - に基づいてWebページのコンテンツを抽出することに関するいくつかの研究を行ってきた>http://www.springerlink.com/index/A65708XMUR9KN9EA.pdf
ステップの概要は次のとおりです。
- 私が抽出したいウェブURLを取得する(単一のウェブページ)
- は、いくつかの視覚的なルールに基づいてWebページからいくつかの要素をつかむ:私のアルゴリズム
- を持つ要素が私のデータベースに結果を保存
- プロセス(例は青色を持っているすべてのH1をつかみます)。
Webページ上の任意の要素である、あなたは正確にアカウントのスタイルシートに取るために、ブラウザ(、マークアップハックをリバースエンジニアリングする必要があるだろう何色私の悪い英語 -
あなたがあなたの問題のために、私はより具体的なアドバイスを提供できるように、(あなたが何をしているか)を達成しようとしているものに拡張していただけますか?ありがとう。 –
あなたの最新情報に基づいて、あなたの質問を次のように変更することをお勧めします: "Rubyで視覚的基準に基づいてHTML文書を解析する方法" –