サイト内にいくつのパブリックページがあるか、たとえばsmashingmagzine.comなどを知りたいと思います。ページ数を数える方法はありますか?サイト内のページ数をカウントする
2
A
答えて
2
0
各ページのマークアップを再帰的にスキャンする必要があります。トップレベルのページから、他のページへのリンクを探して再帰的にクロールします。無限ループに巻き込まれないようスキャンされたものを追跡する必要もあります。
3
site
演算子を使用してGoogleのインデックスにクエリを実行できます。例:
これは、Googleによって現在インデックスされているページのリストを返します。他の検索エンジンでも同様の機能が提供されていますが、私は構文を理解していません。
もちろん、すべてのページがインデックスに登録されているわけではなく、インデックスには存在しなくなったページが含まれている場合があります。
+0
私はGoogleにすべての苦労をさせるという考えが好きです... –
関連する問題
- 1. グリッド内の種の数をカウントする
- 2. イメージ内の円の数をカウントする#
- 3. XMLファイル内のエントリ数をカウントする
- 4. ファイル内の行数をカウントする - Scala
- 5. ファイル内の単語数をカウントする
- 6. プロジェクト内のXMLファイル数をカウントする
- 7. カテゴリ内の記事数をカウントする
- 8. フォルダ内のフォルダ数をカウントする
- 9. Zipファイル内のファイル数をカウントする#
- 10. ボックス内の要素数をカウントする
- 11. ディレクトリ内のファイル数をカウントする
- 12. カウントなしでクエリセット内のアイテム数をカウントする方法
- 13. 関数内で3秒をカウントする
- 14. STS内のコードラインとクラスの数をカウント
- 15. Javascript&Cookies:すべてのページの訪問数をカウントする
- 16. セットリスト内で複数の出現回数をカウントする
- 17. jQuery、ページ上の要素の数を動的にカウントする
- 18. ページの訪問者数をカウントするには? (MVC)
- 19. SQL:1つのクエリ内のカウントの数
- 20. Drupalを使用してページ内に多数のセクションがある開発サイト
- 21. ページ上のコントロールをカウントする
- 22. クローズドフィルタを含むファイル内の行数をカウントする
- 23. Pythonを使用してファイル内の偶数をカウントする
- 24. 現在のディレクトリ内のファイル数をカウントするシェルプログラム?
- 25. Minizinc、ペアの配列内の出現数をカウントする
- 26. Pythonパッケージ内のクラスとクラス階層の数をカウントする
- 27. スプライトシート内の画像の数をカウントする-cocos2d
- 28. リスト内の各アイテムの出現回数をカウントする
- 29. 配列内のオブジェクトの数をカウントする(JavaScript)
- 30. 配列内のワイド文字の数をカウントするmbsctows
私が同じドメインにいるかどうかを確認するにはどうすればよいですか? RegEx? –
リンク先のURLのホストを見ることができます。 URLパーサはPHPでこの情報を簡単に取得できます。 –