2010-11-24 11 views
4

次の2つの標準リンクタグは、スパイダーが同じURLを指していると見なされますか?正準タグとUTF8

<link rel="canonical" href="http://www.example.com/&#375;" /> -
<link rel="canonical" href="http://www.example.com/ŷ" />
エンコード - 100%ではないことを確認

答えて

3

&#375;は、コードポイント375の10進表記でUnicode文字を表すHTMLエンティティです。 16進数では0x177なので、U + 0177はŷです。彼らは、HTMLドキュメントのコンテキストで表示している

  1. http://inamidst.com/stuff/unidata/
  2. 両方のURLが正確ならば同じであることを意味http://www.fileformat.info/info/unicode/char/0177/index.htm
  3. http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references

    • このようなシンボルをサポートする適切な文字セットが宣言されていて、それをタイプしたエディタに正しいコードが挿入されています。

両方の場合にブラウザにdisplaysが表示された場合は、文字セットが正しいと思われますが、そのことを確認する必要があります。

1

エンコードされていないを、私は彼らの両方が同じURLを指すと思います。しかし、W3標準を見ると、しばしばコード化されるリンクを提案することを覚えておいてください。

1

あなたのHTMLをUTF-8として通信すると、URLは同じものとみなされます。

1

現代のブラウザでも動作することは期待できますが、http://www.example.com/ŷis an invalid URLです。

ユニコード文字を常にパーセントでエンコードする必要があります。