目に余るmojibake例hexdump -C
です:
は、これは私が見ていものです。かつて、(ほとんどの既知の)OEMおよびANSIコードページとUnicodeテーブルとのマッピングを示す小さな.bat
スクリプトを作成しました。
==> alts.bat 0x85
CP/ACP Hex Codepoint #Description :show8bit 133 <--> 0x85)
------ --- --------- ------------------------
CP1250 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1251 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1252 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1253 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1254 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1255 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1256 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1257 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1258 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP437 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE
CP737 0x85 0x0396 #GREEK CAPITAL LETTER ZETA
CP775 0x85 0x#LATIN SMALL LETTER G WITH CEDILLA
CP850 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE
CP852 0x85 0x016f #LATIN SMALL LETTER U WITH RING ABOVE
CP855 0x85 0x0401 #CYRILLIC CAPITAL LETTER IO
CP857 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE
CP860 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE
CP861 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE
CP862 0x85 0x05d5 #HEBREW LETTER VAV
CP863 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE
CP864 0x85 0x2500 #FORMS LIGHT HORIZONTAL
CP865 0x85 0x00e0 #LATIN SMALL LETTER A WITH GRAVE
CP866 0x85 0x0415 #CYRILLIC CAPITAL LETTER IE
CP869 0x85 #UNDEFINED
CP874 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP932 0x85 #DBCS LEAD BYTE
CP936 0x85 #DBCS LEAD BYTE
CP949 0x85 #DBCS LEAD BYTE
CP950 0x85 #DBCS LEAD BYTE
==>
およびその逆0x2026
コードポイントのための(悪い出力列の申し訳ありませんが、Windows以外のCP線の場合にはシフト):
==> alts.bat 0x2026
CP/ACP Hex Codepoint #Description :show16bit 8230 <--> 0x2026
------ --- --------- -------------------------
CP1250 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1251 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1252 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1253 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1254 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1255 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1256 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1257 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP1258 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP874 0x85 0x2026 #HORIZONTAL ELLIPSIS
CP932 0x8163 0x2026 #HORIZONTAL ELLIPSIS
CP936 0xA1AD 0x2026 #HORIZONTAL ELLIPSIS
CP949 0xA1A6 0x2026 #HORIZONTAL ELLIPSIS
CP950 0xA14B 0x2026 #HORIZONTAL ELLIPSIS
macCYRILLIC_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS
macGREEK_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS
macICELAND_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS
macLATIN2_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS
macROMAN_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS
macTURKISH_CP 0xC9 0x2026 #HORIZONTAL ELLIPSIS
==>
さらにリーディング:Encodings and Code Pages
ここ
0x85
コードの特定の結果です
これが起こる唯一の方法は、ブラウザがページの報告された文字セットを無視し、代わりにユーザー指定の上書きなど、別の文字セットを使用する場合です。しかし、どの文字セットが0x85をU + 016Fと解釈するかわかりません。 CP-12xx/Windows-12xxの文字セットはありません。0x85はU + 2026 HORIZONTAL ELLIPSISです。 ISO-8859-xのどれも0x85をまったくサポートしていません。 –
0x85をU + 016F:[CP852](http://www.kreativekorp.com/charset/encoding.php?name=CP852)(DOS Latin-2)と解釈する文字セットを見つけましたが、[ ISO-8859-2](https://en.m.wikipedia.org/wiki/ISO/IEC_8859-2)(ISO Latin-2)を参照してください。 –
ありがとう@RemyLebeau、通常設定されているブラウザがテキストをDOS Latin-2として扱っているのは奇妙に思えますが、少なくともそれは私が思いついている "魔法"よりも理にかなっています。私は別の文字と重複することができるかどうかを調べるためにさらにテストをします。 –