2009-06-08 11 views
2

既知のRSSフィードのコレクションでユーザーがコンテンツを検索できるようにするには、SharePointサイトを使用します。私はフィード彼らの元でこの外部RSSフィードのSharePoint検索

  • クロールを行うには、概念的にはいくつかの方法を理解する(む〜!)
  • 私のSharePointサイトへの完全な記事を引き、その後、私のクローラーのクロールのそれは
  • メイクの使用を聞かせて既存のインデックスは、(Googleのような)
  • 完全な記事を検索、オンデマンドで、Googleのユーティリティのようなもの(私の好み)

を使用すると、だから私は何とか、私のSharePointサイトから、ユーザーがフルを検索できるようにすることができますからの記事カップルのダースは、名前の、RSSは

おかげ

ケーリーを供給し

答えて

1

そのソースでフィードをクロールに問題がある私はなぜ表示されないのですか?それは妥当と思われるでしょう。

コンテンツソースを作成してフィードをポイントし、正しいインデックススケジュールを選択するのはかなり簡単です。それが機能しない場合は、より複雑なアプローチを試すことができます。

自分でホストする別のウェブサイトのコンテンツをコピーすると、著作権に影響する可能性があることに注意してください(炎症性コンテンツが自分のサイトに公開されているように見えるリスクはありません)。

--update--

は、(それが一つでもあります)、それは所望の周波数を持っているかどうかを確認するためにrobots.txtの標的部位を読んでみてください。それ以外の場合は、クロールするサイトの深さによって異なります。

rssフィードxmlだけをクロールしている場合は、誰にも迷惑をかけずに毎時間行うことができると思われます。それ以外の場合は、各記事にアクセスする場合は、制限することができます。実際にあなたが標的サイトとあなたが当てているサイトのタイプとの関係に多く依存しています。

のrobots.txt

とどのようにSharePointのお得な情報にはほとんど詳細はチェックアウトthis article(PSターゲットサイトがウェブ上の記事を入れていないので、誰もがそれらを読まないでしょう)

+0

Thanks Nat、 フィードをクロールすることについて - 私はターゲットサイトへのパフォーマンスへの影響を考えていました。明らかに主要な検索エンジンがそれを行いますが、私のサイトは主要な検索エンジンではありません。そのような振る舞いはぼやけていますか? クライアントからの提案もありましたが、私はコンテンツのダウンロードを真剣に検討していませんでした。しかし、あなたはそれほど感謝しない理由があります。 –

+0

あなたはどのくらい頻繁にクロールを考えていましたか? – Nat

+0

もう一度ありがとうNat。私は先週あなたの編集を見ましたが、今までこの質問は表示されませんでした。 1日に1回は外部サイトをクロールするだけで十分です。 –

0

のうちボックスクローラはrobots.txtを尊重し、SharePointが外部サイトでビートダウンを実行する可能性を軽減するクローラ影響ルールの規定があります。