2016-11-04 4 views
0

このurlのホームページからデータを解析したいと思います。あなたが見ることができるように、このURLはHTMLファイルであり、私は以下の読み:PHPファイルのHTMLファイルからDOMオブジェクトを作成するにはどうしたらいいですか?

// Create a DOM object from a HTML file 
$html = file_get_html('test.htm'); 

ので、私はちょうど

include "simple_html_dom.php"; 
$html = file_get_html('eecs.kookmin.ac.kr/site/computer/notice.htm'); 
echo $html->plaintext; 

以下のコードを入力し、エラーメッセージは次のとおりです。

Error message Warning: file_get_contents(eecs.kookmin.ac.kr/site/computer/notice.ht‌​m): failed to open stream: No such file or directory in C:\Bitnami\wampstack-5.6.27-0\apache2\htdocs\simple_html_dom‌​.php on line 76

何私がすべき行う?

+1

良いDOMパーサはhttp://php.net/manual/en/class.domdocument.phpです – scaisEdge

+0

dear Jose、私はこのホームページ(http://eecs.kookmin.ac.kr/)からテキストを抽出します。サイト/コンピュータ/ notice.htm)しかし、このPHPファイルをサーバに実装すると、エラーメッセージが表示される 警告:file_get_contents(eecs.kookmin.ac.kr/site/computer/notice.htm):ストリームを開けませんでした:そのようなファイルはありませんまたはC:\ Bitnami \ wampstack-5.6.27-0 \ apache2 \ htdocs \ simple_html_dom.php 76のディレクトリにあるディレクトリ – Hansam

+0

(eecs.kookmin.ac.kr/site/computer/notice.ht m)このリンクはありませんurlだがhtmlファイル。 PHP Simple HTML DOM Parser Manualを読んでいます。このマニュアルの内容は // HTMLファイルからDOMオブジェクトを作成してください $ html = file_get_html( 'test.htm');私は$ html = file_get_html( 'eecs.kookmin.ac.kr/site/computer/notice.htm')と思う。この部分は特にエラー( 'eecs.kookmin.ac.kr/site/computer/notice.htm') – Hansam

答えて

0

スヌーピークラス(https://sourceforge.net/projects/snoopy)を使用してHTMLコードを取得できます。次のコードは、<textarea>タグの内側にHTMLコードが表示され、それはページ自体を表示し、コピー&ペーストを次のコードPHPファイルで、ブラウザで開き:

<!DOCTYPE html> 
<html> 
    <head> 
    <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=euc-kr"> 
    <META HTTP-EQUIV="Content-language" CONTENT="ko"> 
    </head> 
    <body> 
<?php 
require("Snoopy.class.php"); // ◄■■ GET SNOOPY FROM https://sourceforge.net/projects/snoopy 
$snoopy = new Snoopy; 
$snoopy->fetch("http://eecs.kookmin.ac.kr/site/computer/notice.htm"); 
$html = mb_convert_encoding($snoopy->results, "UTF-8", "EUC-KR"); // ◄■■ GET HTML CODE. 
echo "<textarea rows='25' cols='80'>$html</textarea>"; // ◄■■ DISPLAY THE HTML. 
echo $html; // ◄■■ DISPLAY THE WEBPAGE. 
?> 
    </body> 
</html> 

スヌーピークラスは、一つだけのファイルですファイルがPHPファイルと同じディレクトリにあることを確認してください。

+0

ありがとう、ホセ!あなたの親切な答え私はあなたの方法で試してみましょう。問題がある場合は、質問をしてもらえますか? – Hansam

+0

@ハンサム、確かに質問をしてください。 –

+0

スヌーピーは本当に死んだプロジェクトです。代わりに[guzzle](https://github.com/guzzle/guzzle)を試してみてください。 – pguardiario

関連する問題