2016-05-30 5 views
0

何らかの理由で、一部のブラウザでは、CP-1252省略記号(0x85)が「...」として表示されます。私は、サーバーがUTF-8であると主張していると信じています(なぜUTF-8サーバーがCP-1252を提供しているのか、それは範囲外です)。私はそれが有効なUTF - 8ではないので、警告をスローすることを理解するだろう。私はそれがLatin1の文字U+0085 NEXT LINE (NEL)として現れることを理解するでしょう。しかし私は私の人生にとってなぜそれがU+016F LATIN SMALL LETTER U WITH RING ABOVEと表示されるのか理解できません。いくつかのブラウザでCP-1252省略記号がUの上に表示される理由

enter image description here

そして、ここでファイル

00000000 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 |xxxxxxxxxxxxxxxx| 
* 
00000030 78 85 3c 2f 69 3e 0d 0a       |x.</i>..| 
00000038 
+0

これが起こる唯一の方法は、ブラウザがページの報告された文字セットを無視し、代わりにユーザー指定の上書きなど、別の文字セットを使用する場合です。しかし、どの文字セットが0x85をU + 016Fと解釈するかわかりません。 CP-12xx/Windows-12xxの文字セットはありません。0x85はU + 2026 HORIZONTAL ELLIPSISです。 ISO-8859-xのどれも0x85をまったくサポートしていません。 –

+0

0x85をU + 016F:[CP852](http://www.kreativekorp.com/charset/encoding.php?name=CP852)(DOS Latin-2)と解釈する文字セットを見つけましたが、[ ISO-8859-2](https://en.m.wikipedia.org/wiki/ISO/IEC_8859-2)(ISO Latin-2)を参照してください。 –

+0

ありがとう@RemyLebeau、通常設定されているブラウザがテキストをDOS Latin-2として扱っているのは奇妙に思えますが、少なくともそれは私が思いついている "魔法"よりも理にかなっています。私は別の文字と重複することができるかどうかを調べるためにさらにテストをします。 –

答えて

1

目に余るmojibakehexdump -Cです:

は、これは私が見ていものです。かつて、(ほとんどの既知の)OEMおよびANSIコードページとUnicodeテーブルとのマッピングを示す小さな.batスクリプトを作成しました。

==> alts.bat 0x85 
CP/ACP Hex Codepoint #Description :show8bit 133 <--> 0x85) 
------ --- --------- ------------------------ 
CP1250 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1251 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1252 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1253 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1254 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1255 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1256 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1257 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1258 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP437 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE 
CP737 0x85 0x0396 #GREEK CAPITAL LETTER ZETA 
CP775 0x85 0x#LATIN SMALL LETTER G WITH CEDILLA 
CP850 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE 
CP852 0x85 0x016f #LATIN SMALL LETTER U WITH RING ABOVE 
CP855 0x85 0x0401 #CYRILLIC CAPITAL LETTER IO 
CP857 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE 
CP860 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE 
CP861 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE 
CP862 0x85 0x05d5 #HEBREW LETTER VAV 
CP863 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE 
CP864 0x85 0x2500 #FORMS LIGHT HORIZONTAL 
CP865 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE 
CP866 0x85 0x0415 #CYRILLIC CAPITAL LETTER IE 
CP869 0x85   #UNDEFINED 
CP874 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP932 0x85   #DBCS LEAD BYTE 
CP936 0x85   #DBCS LEAD BYTE 
CP949 0x85   #DBCS LEAD BYTE 
CP950 0x85   #DBCS LEAD BYTE 

==> 

およびその逆0x2026コードポイントのための(悪い出力列の申し訳ありませんが、Windows以外のCP線の場合にはシフト):

==> alts.bat 0x2026 
CP/ACP Hex Codepoint #Description :show16bit 8230 <--> 0x2026 
------ --- --------- ------------------------- 
CP1250 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1251 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1252 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1253 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1254 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1255 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1256 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1257 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP1258 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP874 0x85 0x2026 #HORIZONTAL ELLIPSIS 
CP932 0x8163 0x2026 #HORIZONTAL ELLIPSIS 
CP936 0xA1AD 0x2026 #HORIZONTAL ELLIPSIS 
CP949 0xA1A6 0x2026 #HORIZONTAL ELLIPSIS 
CP950 0xA14B 0x2026 #HORIZONTAL ELLIPSIS 
macCYRILLIC_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS 
macGREEK_CP  0xC9 0x2026 #HORIZONTAL ELLIPSIS 
macICELAND_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS 
macLATIN2_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS 
macROMAN_CP  0xC9 0x2026 #HORIZONTAL ELLIPSIS 
macTURKISH_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS 

==> 

さらにリーディング:Encodings and Code Pages

ここ 0x85コードの特定の結果です
関連する問題