2011-07-09 13 views
3

を使用して、他のウェブサイトからのHTML私は、次のURLから、次のHTMLを解析しようとしている:解析(無効)PHP

http://md5.rednoize.com/?q=fbade9e36a3f36d3d676c1b808451dd7

コード:

$html = file_get_contents($url.$hash); 
    $config = array(
     'clean' => 'yes', 
     'output-html' => 'yes', 
    ); 
    $tidy = tidy_parse_string($html, $config, 'utf8'); 
    $tidy->cleanRepair(); 
    $dom = new DOMDocument; 
    $dom->loadHTML($tidy); 

    $result = $dom->getElementById('result'); 

それが無効であるしかし、 :

Warning: DOMDocument::loadHTML() [<a href='domdocument.loadhtml'>domdocument.loadhtml</a>]: ID switcher already defined in Entity, line: 128 in 

まだ構文解析できる方法はありますか?

+0

多分愚かな発言をしていますが、単に「クリーン」=>「はい」、いいえ「クリーン」=>」へを置くカント'、? –

+0

@ハンス:なぜ私はそれをしたいですか? – PeeHaa

+0

'$ dom-> loadHTML($ tidy);'を '$ dom-> loadHTML($ tidy-> value);に変更するとどうなりますか? –

答えて

4

あなたは、厳密なエラーチェックをオフにした後、それを解析しようとすることができます

$dom = new DOMDocument; 
$dom->strictErrorChecking = FALSE; 
$dom->loadHTML($tidy);