URIの代わりに属性値として非ASCII文字を含むIRI(例:href
属性)を使用するのは有効なHTMLですか? HTMLフレーバー(HTMLとXHTML、4と5)には違いがありますか?少なくともRFC 3986はそれがそうでないことを暗示しているようです。IRIはHTML属性値として有効ですか?
エンコード率を使用することは、以前のIRI対応ソフトウェアに比べて安全である可能性が高いと認識していますが、私はその標準に関して明確な答えを探しています。
これまではW3C validatorでいくつかのテストを行いましたが、URIのエスケープされていないUnicode文字はHTML 4/5とXHTML 4/5のdoctypesで警告やエラーを引き起こしませんメッセージはエラーがないことを意味しません)。
少なくともクロムは未処理のUTF-8 IRIもサポートしますが、HTTPリクエストを開始する前にパーセントエスケープします。また、私のWebサーバー(lighttpd)は、HTTPリクエストでエンコードされていない形式でも、パーセントエンコードでUTF-8文字をサポートしているようです。
[RFC 3987のセクション1.2](http://tools.ietf.org/html/rfc3987#section-1.2)には、[RFC 2616](http://tools.ietf。 org/html/rfc2616)はIRIをサポートしていないので、それらを扱うことは標準外である。あなた(またはあなたのブラウザ、または誰か)は、参照されたリソースを取得する前に、指定されたIRIを最初にURIにマップする必要があります。 – Oliver
[URLのUnicode文字]の重複可能性(http://stackoverflow.com/questions/2742852/unicode-characters-in-urls) –