cheerio

    1

    1答えて

    requestとcheerioを使用して、ポストパラメータからのリンクから各動画のsrcを取得しようとしています。 各動画のsrcを取得するには、すべてのループでrequestオプションのurlを変更する必要があります。しかし、以下のsrcのようなコードを取得しようとすると、リクエストのurlを変更するのがリクエストよりも速いため、リクエストのURLを変更することはリクエストが完了する前に行われま

    0

    1答えて

    ページにtbodyという2つの出現があった場合、2番目の出現のスパン間のすべての値を以下のtbodyに抽出するにはどうすればよいですか? id(id = id1、id = id2など)は、文書全体の第2番目のtbodyに1回だけ表示されます。 <tbody> <tr> <td><b> <span id="id1">1,209</span></b></td>

    1

    1答えて

    Cheerioでは、現在のノードのテキストだけをどのように取得しますか? var cheerio = require('cheerio') const htmlString = '<div>hello<span>world</span></div>' $ = cheerio.load(htmlString, { ignoreWhitespace: true }) console.log

    0

    1答えて

    NodeJSにcheerioとrequestを使ってWebscraperを作っていて、divから特別な値を得ることができません。 私はこのdivから 'idproduit' の値(223)を得るでしょう:(編集) $('.vignettes_produit li').each(function(i, element) { var jsObject = { id: id++, idPr

    0

    1答えて

    私はいくつかのコンテンツのためにウェブサイトをスクラップしようとしていますが、それでも問題はありませんが、スクラップされたテキストは私のためだけにコンソールで利用できます。私はコールバックを処理する方法に何か間違っていると思います。誰でも助けてくれますか? 私のコードは以下の通りです: app.get('/test', function(req, res) { //All the w

    0

    1答えて

    cheerioを使用してクローラを作成していますが、一部のWebサイトではスクリプトが非同期であり、すべてのスクリプトを取得しようとすると選択されません。ここ は、私が使用するコードです: function Test(webUrl) { request(webUrl, function(err, resp, html){ if(!err && resp.statusCode

    0

    1答えて

    次のコンテンツからネストされた順序付きリストを生成する方法はありますか?私はフォーラムを検索し、ソースコンテンツとは異なるクラスに基づいて順序付けリストを生成するために数時間働いた。コンテンツには、最大で6つのネスト レベルが含まれます。 私が必要とするのは、異なるクラスに基づいて順序付きリストを生成することです。サンプルコンテンツに示されているように、以下のような内容のサンプルコンテンツを紹介し

    -1

    1答えて

    誰かがassyncなしでこの次のコードを作成しますか? 以下のコードを実行して、パスを同期して渡したいと思います。 var url = 'http://xxxxxx.com/'; var cont = 1; while(cont != 10){ request(url + cont,function(err, res, html){ var $ = cheerio.l

    1

    1答えて

    これは私が達成しようとしているものです。私は、Webページを巧みに掻き集めて、必要な情報を抽出することができました。このページリンクをhref属性ですぐに利用できるいくつかのWebサイトでこれを実行しています。私の質問は、ページネーション変数は動的であるとき、次のページに移動しない方法です: <ul> <li> <a class="clickPage" href="javas

    0

    1答えて

    私はすべてのURLをウェブサイトから掻き出して配列に入れようとしています。配列インデックスについて質問があります。配列[2]に2のようなインデックス番号を追加すると、コマンドラインは "undefined"と応答します。インデックスを削除して配列全体を印刷すると、すべてのURLが1行ずつ表示されます。私は、各URLになりたい、独自のインデックスのような: などまずURLは= 2番目のURLは 配列