2017-02-28 2 views
-1

私は、上記のサイトからの選択的な文を解析するためのPHP Webクローラーを持っています。PHP Webクローラーのライブラリ(guzzle)を呼び出していますか?

それが正常に働いていたが、私は、サイトの複数のページを解析することにwhileループを追加したとき、それはWarning: require_once(github.com/guzzle/guzzle): failed to open stream: No such file or directory

としてエラーを来た私はhttps://github.com/guzzle/guzzle からがつがつ食うフォルダをダウンロードしたが、それでも正しい識別のように思えるんでした私のスクリプトでは正しく実行されていません。

として私のスクリプトが行く:実際に返すことになって何

<?php 
    $i = 1; 
    while(true){ 
    require_once('github.com/guzzle/guzzle'); 
    $subject = file_get_html('http://www.usmleforum.com/forum/index.php?forum=1&Page='+$i); 
    preg_match_all('/<td.+?FootNotes2.+?<a.+?<\/a> - (?P<name>.*?)<\/td>.+?<td.+?FootNotes2.+?(?P<date>\d{2}\/\d{2}\/\d{2} \d{2}:\d{2})/siu', $subject, $matchs); 

    foreach ($matchs['name'] as $v){ 
    echo $v. " "; 
    } 
    foreach ($matchs['date'] as $v){ 
    echo $v. " "; 
    } 
    } 
    $i++; 
?> 

サイト内のすべてのページの名前や日付などのテキストとしてタグ付きテキストを印刷することである

すべてのヘルプは高く評価され、 ..

答えて

0

フォルダの名前を変更するか、ファイルを最短パスに入れてみてください。そしてrequire_once()は、フォルダではなくファイルを要求することです

+0

私はフォルダの名前をどのようにすればよいですか ? – harishk

+0

好きですが、require_onceはファイル(http://php.net/manual/en/function.require-once.php) –

+0

のためだけです。実際には、require_onceやguzzle'と 'whileループ '、それは正常に働いたが、その後、すべてのページからデータを取得するループを追加し、それはエラーを示したので、友人はこのおじさんの事を追加することを提案..これはかなり新しい?\ – harishk

関連する問題