2016-06-21 1 views
1

私はHTMLファイルのリストを持っています。私は定期的に行う必要があることはヘッダ部</head>の終わりを見つけるRでそれらを開き、手動でのようなコードの特定のセットを貼り付けていると言う:
R - htmlを自動的に編集するコード

<p>This report helps you find the critical issues in your data</p>

誰かがその自動的にコードを書くことで私を助けることができますヘッダータグの終わりを見つけ、与えられた行のセットをペーストしますか?

同じ運動は、いくつかの他のツールでなんとかかもしれないが、特にR用

答えて

0

私を支援してください私はあなたがXMLページを使用してHTMLファイルを検索するのに役立つXPathクエリ、学びたいと思います。すべてのファイルをsome_dirにダウンロードし、テキストを解析して<p>の文字列を<div class="come_class">にしたかったとします。

library(XML) 
files <- list.files("some_dir", full.names = TRUE, include.dirs = TRUE) 
docs <- lapply(files, htmlParse) 

text.nodes <- 
    lapply(docs, function(doc) 
    getNodeSet(doc, '//div[@class="some_div"]//p')) 

text.value <- 
    lapply(text.nodes, function(node) 
      sapply(node, xmlValue)) 
+1

OPは、XMLドキュメントへの返信のためにあまりにも – hrbrmstr

+0

nograpesのおかげで、テキストを追加したいかなり確信して、@hrbrmstrは、私は、HTMLの行を入力し、それを保存、編集したい、真実です。あなたのコードは私がセクションを見つけるのを助けていますが、どのようにしてそれを編集して編集しますか? –

+0

@AnuragH 'XML'パッケージには' addNode() '、' addChildren() '、' addSibling() '(etc) – hrbrmstr

関連する問題