2012-04-18 12 views
0

ユニコードコンテンツを持つブログがいくつかあり、それらを新しいサーバーCentOS - Apacheに移行しました。今、ユニコードフォントはジャンクとして表示され、何が問題になったのか分かりません。ユニコードフォントはUTF-8でも迷惑メールとして表示されます

私のwp-configとApache AddDefaultCharsetは、UTF-8に設定されています。それでも、私はジャンクを見る。

ところで、同じサーバーは、非WPページでもUnicodeコンテンツを提供します。しかし、3つのWPサイトにはこの問題があります。

サンプル内容: à®...à®à®®à®àà®®à®à®à®ààà®à®à®à௠சà¯à®•à¯à®•à®¿à®³à®¿à®¯à¯‡、

My DB details:mysql> show variables like 'char%'; 
+--------------------------+----------------------------+ 
| Variable_name   | Value      | 
+--------------------------+----------------------------+ 
| character_set_client  | latin1      | 
| character_set_connection | latin1      | 
| character_set_database | latin1      | 
| character_set_filesystem | binary      | 
| character_set_results | latin1      | 
| character_set_server  | latin1      | 
| character_set_system  | utf8      | 
| character_sets_dir  | /usr/share/mysql/charsets/ | 
+--------------------------+----------------------------+ 
8 rows in set (0.00 sec) 

私はまた、既存のDBのコンテンツのエンコーディングようにそれを変更する方法教えてください変更されます。

+0

移行後にデータベースの照合を確認しましたか? –

+0

質問は適切ですが、スタックオーバーフローで回答が得られるチャンスがあります。 – Bainternet

答えて

1

あなたのデータは誤ってエンコードされています。 UTF-8データはCP1252として解釈されます。

>>> print u'அழகிய நிறம'.encode('cp1252').decode('utf-8') 
அழகிய நிறம 
+0

どうすれば修正できますか? – San

+0

そしてその解釈は?サーバーまたはデータベース?私の理解を助けてください。 – San

+0

低レベルのツールを使用すると、実際にデータベースに格納されているバイトシーケンスを確認できます。これはあなたの次のステップが何であるかを理解するのに役立ちます。 –

関連する問題