2011-02-25 8 views
1

ノート:質問のタイトルこのメタQ&AChromeとSafariでUTF8を処理していますが、UTF8の文字がハードコードされていないとFirefoxとIEが違うのですか?

で説明したように変更され、私はaccent pluginとjQueryのbassistanceのオートコンプリートのプラグインを使用していますので、私はアクセントなしのオートコンプリートを持っています。アクセントマップは、このようなものです:

map={'À':'A', 'İ':'I'}; 

私は文字İ(ポイントとトルコ語の大文字I)との問題を抱えています。私はアクセントを削除し、小文字に変換した後、私はこのコードを持っている:

("İstanbul").indexOf("is") 

をFirefoxとIEは0を与えるが、ChromeとSafariは-1を与えます。

charCodeAt(0)すべてのブラウザで同じ結果が得られます。

それはChromeとSafariは通常のIとアクセントのないI異なっを扱うようです。

EDIT

こんにちは再び、約5ヶ月後、私は最終的に私の質問に多くのソースを追加することができます。
幸いなことに、質問日とその日のバックアップは私がソースコードを見つけるのに役立ちます。

、BEFORE(TURKISHのI BUG)私はAFTER(WORKS OK)で自分のコードを変更したときにが修正されました。 (トルコ語である)
私も追加以下の私の文書charshet

私はユニコード専門家ではないけど、あなたは私を「クロームFF対」問題について推測してみましょう場合:
クロームは、「ソースコード」とcharactherを扱います、私は

の\ u0128
FFが "可視characher" とそれを扱うように、私は(TURKISH IのBUG)の前に "I"

のような意味を意味します彼は( "イスタンブール" 置き換え

function remove_accent(str) {var map={'À':'A','Á':'A','Â':'A','Ã':'A','Ä':'A','Å':'A','Æ':'AE','Ç':'C','È':'E','É':'E','Ê':'E','Ë':'E','Ì':'I','Í':'I','Î':'I','Ï':'I','Ð':'D','Ñ':'N','Ò':'O','Ó':'O','Ô':'O','Õ':'O','Ö':'O','Ø':'O','Ù':'U','Ú':'U','Û':'U','Ü':'U','Ý':'Y','ß':'s','à':'a','á':'a','â':'a','ã':'a','ä':'a','å':'a','æ':'ae','ç':'c','è':'e','é':'e','ê':'e','ë':'e','ì':'i','í':'i','î':'i','ï':'i','ñ':'n','ò':'o','ó':'o','ô':'o','õ':'o','ö':'o','ø':'o','ù':'u','ú':'u','û':'u','ü':'u','ý':'y','ÿ':'y','Ā':'A','ā':'a','Ă':'A','ă':'a','Ą':'A','ą':'a','Ć':'C','ć':'c','Ĉ':'C','ĉ':'c','Ċ':'C','ċ':'c','Č':'C','č':'c','Ď':'D','ď':'d','Đ':'D','đ':'d','Ē':'E','ē':'e','Ĕ':'E','ĕ':'e','Ė':'E','ė':'e','Ę':'E','ę':'e','Ě':'E','ě':'e','Ĝ':'G','ĝ':'g','Ğ':'G','ğ':'g','Ġ':'G','ġ':'g','Ģ':'G','ģ':'g','Ĥ':'H','ĥ':'h','Ħ':'H','ħ':'h','Ĩ':'I','ĩ':'i','Ī':'I','ī':'i','Ĭ':'I','ĭ':'i','Į':'I','į':'i','İ':'I','ı':'i','IJ':'IJ','ij':'ij','Ĵ':'J','ĵ':'j','Ķ':'K','ķ':'k','Ĺ':'L','ĺ':'l','Ļ':'L','ļ':'l','Ľ':'L','ľ':'l','Ŀ':'L','ŀ':'l','Ł':'L','ł':'l','Ń':'N','ń':'n','Ņ':'N','ņ':'n','Ň':'N','ň':'n','ʼn':'n','Ō':'O','ō':'o','Ŏ':'O','ŏ':'o','Ő':'O','ő':'o','Œ':'OE','œ':'oe','Ŕ':'R','ŕ':'r','Ŗ':'R','ŗ':'r','Ř':'R','ř':'r','Ś':'S','ś':'s','Ŝ':'S','ŝ':'s','Ş':'S','ş':'s','Š':'S','š':'s','Ţ':'T','ţ':'t','Ť':'T','ť':'t','Ŧ':'T','ŧ':'t','Ũ':'U','ũ':'u','Ū':'U','ū':'u','Ŭ':'U','ŭ':'u','Ů':'U','ů':'u','Ű':'U','ű':'u','Ų':'U','ų':'u','Ŵ':'W','ŵ':'w','Ŷ':'Y','ŷ':'y','Ÿ':'Y','Ź':'Z','ź':'z','Ż':'Z','ż':'z','Ž':'Z','ž':'z','ſ':'s','ƒ':'f','Ơ':'O','ơ':'o','Ư':'U','ư':'u','Ǎ':'A','ǎ':'a','Ǐ':'I','ǐ':'i','Ǒ':'O','ǒ':'o','Ǔ':'U','ǔ':'u','Ǖ':'U','ǖ':'u','Ǘ':'U','ǘ':'u','Ǚ':'U','ǚ':'u','Ǜ':'U','ǜ':'u','Ǻ':'A','ǻ':'a','Ǽ':'AE','ǽ':'ae','Ǿ':'O','ǿ':'o'};var res='';for (var i=0;i<str.length;i++){c=str.charAt(i);res+=map[c]||c;}return res;} 

EDIT2

var charToAccentedCharClassMap = { 
// A to H 
    'I': '[Iiı\xcc-\xcf\xec-\xef\u0128-\u0130\u0132\u0133\u01cf\u01d0\u0208-\u020b\u1d35\u1d62\u1e2c\u1e2d\u1ec8-\u1ecb\u2071\u2110\u2111\u2139\u2148\u2160-\u2163\u2165-\u2168\u216a\u216b\u2170-\u2173\u2175-\u2178\u217a\u217b\u24a4\u24be\u24d8\u337a\u33cc\u33d5\ufb01\ufb03\uff29\uff49]' 
// J to Z 
    }; 

function deaccent(accentedString) { var result = accentedString; for (var key in charToAccentedCharClassMap) { result = result.replace(new RegExp(charToAccentedCharClassMap[key], "g"), key); } //console.log(accentedString) return result.toLowerCase(); }

function remove_accent(str) { return deaccent(str).toLowerCase(); return str; }

(WORKS OK)AFTER少し補正(SOユーザー編集した質問が、ミスİ彼のキーボード) ).indexOf( "is")by( "istanbul")。indexOf( "is")

+4

完全なコードサンプルを投稿できますか?私はちょうど '' istanbul ".indexOf(" is ")'を私のChromeコンソールにコピーアンドペーストして正しく動作しました。 –

+0

おそらくjsfiddle.netを使って私たちと共有できる最小限の例を作りましょう。 –

+0

文字のアクセントを削除して 'í'などを' i'にすることはできませんか?次に、 'is'をチェックするだけです。 – pimvdb

答えて

2
("istanbul").indexOf("is") 
("Istanbul").toLowerCase().indexOf("ıs") 

小文字の「I」は「ı」です。それはここで起こっているのでしょうか?

EDIT:

おそらく遅すぎる、私はそれが異なるUnicode文字だったので、私は「@」は「@」とは異なっていた非常によく似たケースに遭遇し、今覚えています。 "\u0040"のような文字列のUnicode番号をハードコーディングして解決しました

関連する問題