Googleのサイトで* .htmlファイルのインデックスを防止したいので、きれいなURLだけがインデックスに登録されます。Robots.txt - .htmlファイルのインデックスを無効にする
だから私は現在、私が持っているインデックス付きwww.example.com/en/login
なくwww.example.com/en/login/index.html
をしたいと思います:私はちょうど例えば禁止することができます知っている
User-agent: *
Disallow:/
Disallow: /**.html - not working
Allow: /$
Allow: /*/login*
Disallow: /*/login/index.html
しかし、私の問題はインデックス化したくないこれらの.htmlファイルが多数あることです。個々に行うのではなく、すべてを許可しない方法があるのかと不思議です。
私は、Googleのウェブマスターのrobots.txtテスターで 'Disallow:/ **。html $'を使っていて、動作しているようです。 –