今天遇到了String乱码怎么都去不了的问题,最后的解决方法很简单,也不是方法的问题,是数据过滤之后进行的数据处理,在处理阶段生成了乱码,难怪我在过滤阶段怎么去都去不掉- -,不过花时间知道了很多处理乱码的方法,在这里记录一下。
在将中文数据转成json格式的时候,碰到了很多char型直接显示出来的,比如\u0000, \u201d, \u201c
首先我想到的是我的数据筛选出现了问题,于是去修改了筛选的部分:
title = title.replaceAll("\\u0000","");
title = title.replaceAll("\u0000","");
首先是这种,利用String的replace和replaceAll方法去过滤,这也是大部分乱码过滤的方法。
在这之后,我使用了直接循环处理char的方法,将String变成char型,然后一个一个判断,虽然比较笨这个方法,但是也算一种吧,谁让我菜呢。
之后我猜可能是编码问题导致了乱码,而现在不情况是只有个别字符串中出现了乱码,大部分还是正确的,所以不存在编码问题。
后来我是在想是不是String转Json的时候出现了问题,于是,将spring自带的json换成了阿里的fastjson,解决了部分的乱码问题(\u201d, \u201c),但是\u0000这个东西就是去不掉。
google里有人说string转json最好用list也不是string[]
https://stackoverflow.com/questions/36696090/how-to-use-gson-to-encode-string-array-data-into-json-properly
我的解决
最后,我试着在数据处理完成后再删除\u0000, 结果成功,哎,感觉浪费了好几个小时啊。
补充:Java 中各种空(''、\u0000、null)的区别?
在使用下面的SQL查询时,发现去不掉空格,而且把limit 去掉以后空格就没有了,琢磨了很久才发现问题的关键所在。
主要是\u0000在作怪!!!
select id,company_name,username,remarks,address from table_alldata where company_name !='' and remarks is null limit 1000;
结果是这样的:
回答:从class字节码的角度来理解吧
1.String s1 = ""的情况,下面是编译后的字节码,可以看到,这种情况s1="aaa"其实没什么区别的,都是从常量池推一个字符串到栈顶,并赋给本地变量。
2.String s2=null的情况,这个时候,并没有在常量池中生成任何的字符串常量,仅仅是将null推送到栈顶赋值给变量。
3.String s3 = "u0000"的情况,会在常量池生成一个表示NUL的一个字符串,也就是所谓的Control Character。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。如有错误或未考虑完全的地方,望不吝赐教。
原文链接:https://blog.csdn.net/zyh568879280/article/details/86677646