でW3Cによると、私は次の警告だ:私はPHP 5.3.xで、それを開発していますので、私はNormalizerを使用することができます正規化ユニコード<a href="http://validator.w3.org/" rel="nofollow">W3C validator</a>に私のウェブサイトのHTMLコードを検証しながらPHP
Line 157, Column 220: Text run is not in Unicode Normalization Form C.
…i͈̭̋ͥ̂̿̄̋̆ͣv̜̺̋̽͛̉͐̀͌̚e͖̼̱ͣ̓ͫ͆̍̄̍͘-̩̬̰̮̯͇̯͆̌ͨ́͌ṁ̸͖̹͎̱̙̱͟͡i̷̡͌͂͏̘̭̥̯̟n̏͐͌̑̄̃͘͞…
をクラス。
これを修正するには、ユーザーが入力した内容(たとえばコメント)を表示するときにNormalizer::normalize($output)
を使用するか、またはユーザー入力にNormalizer::normalize($input)
を使用する必要がありますか?
tl; dr:データベースにユーザー入力を格納する前に、または表示されたときにUnicode normalizationを使用する必要がありますか?
あなたのページにはどのような種類のデータが表示されていますか?これは、データではなくバリデータの問題に似ています。 – powtac
ユーザーが正当に投稿できる[this](http://eeemo.net/)のようなものです。ひどく見える上付き文字と下付き文字がたくさんあるだけのテキストです。 – federicot
興味深い:私は確かにバリデーターはそのような種類の文字の組み合わせで壊れていると確信しています...しかし、私もこのスレッドhttp://comments.gmane.org/gmane.org.w3c.validator/13243を見つけました – powtac