为什么PHP json_encode函数将UTF-8字符串转换为十六进制实体?


148

我有一个处理多种语言的PHP脚本。不幸的是,每当我尝试使用时json_encode,任何Unicode输出都将转换为十六进制实体。这是预期的行为吗?有什么方法可以将输出转换为UTF-8字符?

这是我所看到的示例:

输入

echo $text;

输出值

База данни грешка.

输入

json_encode($text);

输出值

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."

Answers:


355

从PHP / 5.4.0开始,有一个名为的选项"JSON_UNESCAPED_UNICODE"。看看这个:

http://se2.php.net/json_encode

因此,您应该尝试:

json_encode( $text, JSON_UNESCAPED_UNICODE );

3
啊哈 谢谢!我应该更仔细地阅读文档。谢谢。
大卫·琼斯

3
JSON_UNESCAPED_UNICODE在PHP 5.4.0中引入,在早期版本中不可用。在较早版本中使用它时,将出现以下错误:“警告:json_encode()期望参数2长,字符串在...中给出”。有关5.3解决方案,请参见下面的CertaiN答案。
Octavian Naicu 2014年

这也适用于丹麦字母Æ,æ,Ø,ø,Å,å谢谢!
ymerdrengene '16

太棒了,这是我想要的答案!
randomizer

2
你才救了我的命 谢谢。
乔恩·赞吉图

57

JSON_UNESCAPED_UNICODE在PHP 5.4或更高版本上可用。
以下代码适用于5.3版。

更新

  • html_entity_decodepack+ 更有效率mb_convert_encoding
  • (*SKIP)(*FAIL)通过JSON_HEX_*标志跳过反斜杠本身和指定字符。

 

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}

1
\ u不应该是\ U即大写吗?
malhal 2014年

4
PHP <5.4的不错的解决方案;)
qdev

由于主机未升级到5.4,我一直在寻找3天的5.3版解决方案。对我来说,您是一个救命的人,而对于如此完整的我,我宁愿将此标记为可接受的答案!
Laci 2014年

修复了字符串包含时的错误\\ 。较新版本\\ 比拥有更高的优先级\u
mpyw '16

这应该添加到php库中。做得好。
Beraki '16



1

这是我针对各种PHP版本的组合解决方案。

在我的公司中,我们正在使用具有不同PHP版本的不同服务器,因此我必须找到适用于所有服务器的解决方案。

$phpVersion = substr(phpversion(), 0, 3)*1;

if($phpVersion >= 5.4) {
  $encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
  $encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}

归功于Marco Gasiabu。json_encode文档中提供了PHP> = 5.4的解决方案。


0

该raw_json_encode()函数上面并没有解决我的问题(由于某种原因,回调函数提出了我的PHP 5.2.5服务器上的错误)。

但是这个其他解决方案确实有效。

https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html

归功于Marco Gasi。我只是调用他的函数,而不是调用json_encode():

function jsonRemoveUnicodeSequences( $json_struct )
{ 
    return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}


-2

自从你问:

有什么方法可以将输出转换为UTF-8字符?

另一个解决方案是使用utf8_encode

这会将您的字符串编码为UTF-8

例如

foreach ($rows as $key => $row) {
  $rows[$key]["keyword"] = utf8_encode($row["keyword"]);
}

echo json_encode($rows);

2
不要使用这个。如PHP文档页面所述,仅当您的原始字符串是ISO-8859-1(Latin1)编码的时候,utf8_encode才是合适的。这不是通用的“确保此字符串是utf-8编码”功能。
telomere

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.