2012-04-12 6 views
2

私は大学に登録されているウェブスペースを所有しています。 Googleは残念ながらそのサイトで私の履歴書(履歴書)を見つけましたが、Google Scholarの引用件数のようなものを台無しにしている学術出版物として誤って索引付けしています。 robots.txtをローカルのサブディレクトリにアップロードしようとしました。問題は、Googleがこのファイルを無視して、代わりに学校ドメインのルールを使用していることです。私はここに学校のドメインのサブディレクトリに `robots.txt`ファイルを使用できますか?

を見つけることができるのrobots.txtを、アップロードした

www.someschool.edu/~myusername/mycv.pdf

のようなものです

は、URLが見えます

www.someschool.edu/~myusername/robots.txt

そして、Googleはそれを無視し、代わりに

www.someschool.edu/robots.txt学校のドメイン

ためrobots.txtを使用しているどのように私は、Googlebotが私の履歴書を無視することができますか?

+0

私は 'robots.txt'は与えられた*ドメインのルートパスにしか使えないかもしれないと思っています* :(この場合は*同じドメイン*、ち​​ょうど別の*パス*です。) –

+2

あなたが持っているのは*サブディレクトリ*です。サブドメインではありません。 - robots.txtはサブドメインでうまく動作します。 – cha0site

答えて

3

悲しいことに、robots.txtは、あなたがGET /robots.txtのときに得られるものであると定義されているため、あなたのサブディレクトリには使用できません。

カスタム.htaccessファイルを使用できる場合、できることはX-Robots-Tag HTTPヘッダーを使用することです。ここにはGoogle's documentation on X-Robots-Tagがあります。

+0

私が知る限り、サイトマップは検索エンジンに重要なコンテンツを伝えます。 –

+0

@John:そうですよね?タグを使ってインデックスを制御することもできます。これはPDFであるために使用できません。 HTTPヘッダー。大学のホームページでカスタム '.htaccess'ファイルを使用できますか? – cha0site

+0

これは良い考えです!今すぐチェック –

関連する問題