rcrawler

    2

    1答えて

    beautifulsoupパッケージ内に、ユーザーがサイト内でクロールの深さを設定できる機能はありますか?私はPythonには比較的新しいですが、以前はRでRcrawlerを使用していました.Rcrawlerは 'MaxDepth'を提供しているので、クローラはそのドメイン内のホームページから一定数のリンク内に入ります。 Rcrawler(Website = "https://stackoverf

    1

    2答えて

    メインURLを使用して、サブドマンからウェブページのコンテンツを抽出します。 私はINDEXのデフォルトの変数を持って、私たちは、ウェブサイトのすべてのURLを参照することができ、このコードを実行した後Rcrawler library(Rcrawler) Rcrawler(Website = "http://www.xbyte-technolabs.com/", no_cores = 4, n