PostgreSQL json内容特殊字符使用unicode代替

less than 1 minute read

背景

json中包含特殊字符时，可能导致输入异常，可以转换为UNICODE后，即可正常输入。

格式为 \u[0-f]{4}

postgres=# select '{"id1":1, "id2":2, "info":"digoal d\u0061t\u0061 ab", "c1":123, "c2":1.1, "c3":1.9999, "crt_time":"2018-01-01 10:10:10"}'::jsonb;  
                                                         jsonb                                                           
-----------------------------------------------------------------------------------------------------------------------  
 {"c1": 123, "c2": 1.1, "c3": 1.9999, "id1": 1, "id2": 2, "info": "digoal data ab", "crt_time": "2018-01-01 10:10:10"}  
(1 row)  

格式

\u[0-f]{4}

json_lex_string@src/backend/utils/adt/json.c  
  
                else if (*s == '\\')  
                {  
                        /* OK, we have an escape character. */  
                        s++;  
                        len++;  
                        if (len >= lex->input_length)  
                        {  
                                lex->token_terminator = s;  
                                report_invalid_token(lex);  
                        }  
                        else if (*s == 'u')  
                        {  
                                int                     i;  
                                int                     ch = 0;  
  
                                for (i = 1; i <= 4; i++)  
                                {  
                                        s++;  
                                        len++;  
                                        if (len >= lex->input_length)  
                                        {  
                                                lex->token_terminator = s;  
                                                report_invalid_token(lex);  
                                        }  
                                        else if (*s >= '0' && *s <= '9')  
                                                ch = (ch * 16) + (*s - '0');  
                                        else if (*s >= 'a' && *s <= 'f')  
                                                ch = (ch * 16) + (*s - 'a') + 10;  
                                        else if (*s >= 'A' && *s <= 'F')  
                                                ch = (ch * 16) + (*s - 'A') + 10;  
                                        else  
                                        {  
                                                lex->token_terminator = s + pg_mblen(s);  
                                                ereport(ERROR,  
                                                                (errcode(ERRCODE_INVALID_TEXT_REPRESENTATION),  
                                                                 errmsg("invalid input syntax for type %s",  
                                                                                "json"),  
                                                                 errdetail("\"\\u\" must be followed by four hexadecimal digits."),  
                                                                 report_json_context(lex)));  
                                        }  
                                }  

参考

json_lex_string@src/backend/utils/adt/json.c

《PostgreSQL 转义、UNICODE、与SQL注入》

digoal’s 大量PostgreSQL文章入口

Twitter Facebook Google+ LinkedIn

PostgreSQL(PPAS 兼容Oracle) 从零开始入门手册 - 珍藏版

17 minute read

背景云数据库PPAS版，是阿里云与EnterpriseDB公司(简称EDB)合作基于PostgreSQL高度兼容Oracle语法的数据库服务，为用户提供易于操作的迁移工具，兼容范围涵盖：PL/SQL、数据类型、高级函数、表分区等。用户可以直接在阿里云购买PPAS进行使用。如果在购买PPAS前，想试用一下...

PostgreSQL pipelinedb 流计算插件 - IoT应用 - 实时轨迹聚合

1 minute read

背景 IoT场景，车联网场景，共享单车场景，人的行为位点等，终端实时上报的是孤立的位点，我们需要将其补齐成轨迹。例如共享单车，下单，开锁，生成订单，骑行，关闭订单，关锁。这个过程有一个唯一的订单号，每次上报的位点会包含时间，订单号，位置。根据订单号，将点聚合为轨迹。使用pipelinedb插件，可以实...

Digoal.zhou

PostgreSQL json内容特殊字符使用unicode代替

背景

格式

参考

digoal’s 大量PostgreSQL文章入口

You May Also Enjoy

PostgreSQL(PPAS 兼容Oracle) 从零开始入门手册 - 珍藏版

PostgreSQL pipelinedb 流计算插件 - IoT应用 - 实时轨迹聚合

PostgreSQL plpgsql 存储过程、函数 - 状态、异常变量打印、异常捕获… - GET [STACKED] DIAGNOSTICS

PostgreSQL datediff 日期间隔（单位转换）兼容SQL用法