2013-05-11 6 views
79

私は多種多様な言語を扱うPHPスクリプトを用意しています。残念ながら、json_encodeを使用しようとすると、すべてのUnicode出力は16進数のエンティティに変換されます。これは期待される行動ですか?出力をUTF-8文字に変換する方法はありますか?PHP json_encode関数がUTF-8文字列を16進数のエンティティに変換するのはなぜですか?

は、ここで私が見ているものの例です:

INPUT

echo $text; 

OUTPUT

База данни грешка. 

INPUT

json_encode($text); 

OUTPUT

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430." 

答えて

180

PHP/5.4.0以降、"JSON_UNESCAPED_UNICODE"というオプションがあります。それをチェックアウト:

http://se2.php.net/json_encode

をので、あなたが試してみてください:

json_encode($text, JSON_UNESCAPED_UNICODE); 
+2

Aha。ありがとう!私はより慎重にドキュメントを読む必要があります。ありがとう。 –

+2

これをデフォルトに設定する方法があるのだろうかと思います。 –

+3

JSON_UNESCAPED_UNICODEはPHP 5.4で導入されました。0、以前のバージョンでは使用できません。以前のバージョンで使用した場合、この警告が表示されます: "警告:json_encode()は、パラメータ2が長く、文字列が...で指定されています。" 5.3ソリューションについては、以下のCertaiNの回答を参照してください。 –

47

JSON_UNESCAPED_UNICODEは、PHPバージョン5.4以降で利用可能です。
次のコードはバージョン5.3用です。 UPDATED

  • html_entity_decode

    pack + mb_convert_encodingよりも少し効率的です。

  • (*SKIP)(*FAIL)は、バックスラッシュ自体と指定された文字をスキップしてJSON_HEX_*フラグを設定します。

 

function raw_json_encode($input, $flags = 0) { 
    $fails = implode('|', array_filter(array(
     '\\\\', 
     $flags & JSON_HEX_TAG ? 'u003[CE]' : '', 
     $flags & JSON_HEX_AMP ? 'u0026' : '', 
     $flags & JSON_HEX_APOS ? 'u0027' : '', 
     $flags & JSON_HEX_QUOT ? 'u0022' : '', 
    ))); 
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/"; 
    $callback = function ($m) { 
     return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8'); 
    }; 
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags)); 
} 
+1

\ uは大文字ではないはずですか? – malhal

+3

PHPの良い解決法<5.4;) – qdev

+0

ホストが5.4にアップグレードしなかったので、私はこのソリューションをVersion 5.3に見つけるために3日間探していました。私にはあなたは人生の節約者です。私はこれを完全なものとするために、これを受け入れられた答えとしてマークしたいと思います。 – Laci

-4

Is this the expected behavior?

json_encode()はUTF-8エンコードされたデータで動作します。

多分あなたはここでそれを変換するための答えを得ることができます:cyrillic-characters-in-phps-json-encode

-1

あなたが尋ねたので:

Is there any way to convert the output to UTF-8 characters?

別の解決策は、utf8_encodeを使用することです。

これは、文字列をUTF-8にエンコードします。

foreach ($rows as $key => $row) { 
    $rows[$key]["keyword"] = utf8_encode($row["keyword"]); 
} 

echo json_encode($rows); 
+0

これは使用しないでください。 PHPのドキュメントページに記載されているように、utf8_encodeは、元の文字列がISO-8859-1(Latin1)にエンコードされている場合にのみ適切です。 「この文字列がutf-8でエンコードされていることを確認してください」という目的をすべて果たしているわけではありません。 – telomere

関連する問題