rcrawler

2熱

1答えて

beautifulsoupパッケージ内に、ユーザーがサイト内でクロールの深さを設定できる機能はありますか？私はPythonには比較的新しいですが、以前はRでRcrawlerを使用していました.Rcrawlerは 'MaxDepth'を提供しているので、クローラはそのドメイン内のホームページから一定数のリンク内に入ります。 Rcrawler(Website = "https://stackoverf

1熱

2答えて

RのRcrawlerを使用してサブドメインから情報を抽出するにはどうすればよいですか？

メインURLを使用して、サブドマンからウェブページのコンテンツを抽出します。私はINDEXのデフォルトの変数を持って、私たちは、ウェブサイトのすべてのURLを参照することができ、このコードを実行した後Rcrawler library(Rcrawler) Rcrawler(Website = "http://www.xbyte-technolabs.com/", no_cores = 4, n