2016-10-01 4 views
1

私は友だち​​と一気にフォーラムを作りました。ボットやスクレイパーが出てくるのを見ています。私たちが抱えている問題は、4つの返信で1ページ/ 1/1を読み込むことができ、それぞれの返信に自身/ reply/1#reply-1への少しのパーマリンクが含まれていることです。私が/ post/1にいて、/ reply/1に移動すると、返信のアンカーだけで、私が始めたところで直ちに終了します。しかし!スクレイパーはこのようなことは考えていないので、すべての/ポストリンクを開いてから、すべての/返信リンクをたどっているので、パフォーマンス上の問題が発生しているため、SEOサイトを調べて解決しようとしています。rel = selfはフォーラムのパーマリンクに使用する正しいrelタグですか?

/replyページでrel = canonicalを使用して、ボットにすべて同じものを伝えましたが、ボットが既にロードされているまでは私にはそれが役に立たないことがわかりますページ、そして私は大量のトラフィックを巻き起こしました。彼らは同じ内容でなければなりませんので、

<a href="/reply/1#reply-1" rel="self">Permalink</a> 

に私の

<a href="/reply/1#reply-1">Permalink</a> 

タグを変更するには正しいだろうか?あるいは、これはrel = "self"を誤用しているでしょうか、代わりに私が使用すべきrelタグがありますか?

+0

私は、SEOについての話であるため、このトピックをオフトピックとして閉じることにしました –

答えて

0

selfリンクタイプは、HTML(しかしfor Atom)のために定義されていないので、それcan’t be used in HTML5文書。

canonicalリンクタイプは(あなたはそれが常に正しいページを指していることを確認した場合、場合にスレッドがページ分割である)あなたのケースに適しているが、それはURLをクロールからボットを防ぐことはできません。

クロールないようにしたい場合は、リンクの種類は(もないnofollowリンクタイプを、それはとにかくnot appropriate for your caseです)を支援しません。あなたはrobots.txtの、例えば:、あなたはパーマリンクの設計を変更することを検討することをお勧めしますと述べ

User-agent: * 
Disallow: /reply/ 

を使用する必要があると思います。私はそれがあなたのユーザーにとっても、ボットにとっても、このようなアーキテクチャを持つことは役に立たないと思います。ドキュメントごとに正確に1つのURLを使用することをお勧めします。ユーザーが特定の投稿にリンクしたい場合は、実際に同じドキュメントであれば新しいページを読み込む必要はありません。

"canonical" URLを使用して、フラグメントコンポーネント(/post/1#reply-1、または意味があるかもしれません:/threads/1#post-1)を追加するか、(ユーザーにとって便利だと思うなら)ページを作成しますそのには返信が含まれています(フルスレッドに戻る)。

+0

ユーザーのユースケースは、ログインしたユーザーがデフォルトのper_page設定をカスタマイズできることです。 '/ post/1'の代わりに'/reply/1'のリンクに従う人は自動的にその返答の正しいページに移動します。 '/ post/1'で同じ振る舞いをするには'/post/1?reply_id = 1'にリンクするかアンカー引数を何らかの方法で解析する必要がありますがどちらも理想的ではありませんでした。 – Marri

+0

@Marri:私はこれを理解していないと思うが、あなたの目標がボットからのこのトラフィックを阻止しているなら、私はあなたの唯一の選択肢はrobots.txtに行くことだと思う。(適合するロボットは、 '/ reply')。 – unor

関連する問題