2011-12-23 6 views
2

PHPを使用して、PHPを使用してページから見出し(h1、h2など)を抽出し、順序付けられていないリスト? WordPress固有のソリューションは問題ありませんが、一般的なPHPソリューションも歓迎します。PHP(特にWordPress)を使用してページの見出しを抽出する方法

EDIT:あなたはXML操作を使用することができ

PHPで
h1 
    h2 
    h3 
    h3 
    h2 
    h3 
    h3 
+0

私はいつもそのリンクを投稿するとは限りませんが、私は見つけるのが怠惰だからですより正確なdupe:[PHPでHTMLを解析するための最善の方法](http://stackoverflow.com/questions/3577641/how-to-parse-and-process-html-with-php) )。 WPと他の実装ではしばしばより単純なアプローチが用いられます。 – mario

答えて

3

、フォームの何かが私は何をしたいです:

http://www.php.net/manual/en/domdocument.getelementsbytagname.php

はまだテストが、なかったの

このような何かのためにh1:

$dom = new DOMDocument(); 

@$dom->loadHTML(file_get_contents('htmlfile.htm')) 

$h1 = $dom->getElementsByTagName('h1'); 

foreach ($h1 as $val){ 
    echo $val->property->__toString(); 
} 

私は関数についてはあまりよく分かりません私はテストすることができません(おそらく明日まで)...私はtostringからhttp://br.php.net/manual/en/class.domelement.php#98851

+0

答えをありがとう。私の見出しのすべてを注文する方法はありますか(私の回答に示されているようにリストを作ることができます)? – mc10

+0

@ mc10あなたは2つのオプションを持っていますが、私は "*"(getElementsByTagName関数で)を使ってすべてのタグを取り出して、あなたが探しているタグをテストするためにforeachループ内の "tagName"を参照してください。 – craniumonempty

+0

他のオプションは何ですか? – mc10

関連する問題