java处理unicode字符
关注:277 答案:4 mip版
解决时间 2021-01-19 19:19
提问者我不想放过你
2021-01-19 01:06
我的unicode字符存在short数组里,本来在c语言是ushort可是java不支持无符号数,我转过来有些字符的码值过大就变为负数了,变为负数的码值转为java的char后就变成乱码了,怎么能让所有unicode字符转为可以显示的String呢?
比如”用户名或密码错误”这个字串
这几个字符从ushort转为short后
“密”和”误”两个字的码值变成了负数。
而转为String后字串变成了”用户名或ᅥ码错!”
没有用,我试过了 本来unsign short就是2个字节 转为int 只是补了两个字节的0,还是显示不了。
最佳答案
二级知识专家你可以浪但我不會等
2021-01-19 02:28
unicode编码简而言之就是将每一个字符用16位2进制数标识。但是通常都用4位的16进制数标识。
例如:
1)中文字符串”你好”的unicode码为:\u60\u597d;
2)英文字符串”ab”的unicode码为:\u0061\u0062;
其中\u是标识unicode码用的,后面的4位16进制数则是对应字符的unicode码。
unicode码在J2EE项目中应用广泛,java对unicode码提供了很好的支持。例如国际化,则是unicode的经典运用。
那么unicode的编码规则具体是什么,如何用程序实现?
1、unicode编码规则
unicode码对每一个字符用4位16进制数表示。具体规则是:将一个字符(char)的高8位与低8位分别取出,转化为16进制数,
如果转化的16进制数的长度不足2位,则在其后补0,然后将高、低8位转成的16进制字符串拼接起来并在前面补上”\u” 即可。
2、转码程序
1)字符串转unicode
public String convert(String str)
{
str = (str == null ? “” : str);
String tmp;
StringBuffer sb = new StringBuffer(1000);
char c;
int i, j;
sb.setLength(0);
for (i = 0; i < str.length(); i++)
{
c = str.charAt(i);
sb.append(“\\u”);
j = (c >>>8); //取出高8位
tmp = Integer.toHexString(j);
if (tmp.length() == 1)
sb.append(“0”);
sb.append(tmp);
j = (c & 0xFF); //取出低8位
tmp = Integer.toHexString(j);
if (tmp.length() == 1)
sb.append(“0”);
sb.append(tmp);
}
return (new String(sb));
}
2)unicode转成字符串,与上述过程反向操作即可
public String revert(String str)
{
str = (str == null ? “” : str);
if (str.indexOf(“\\u”) == -1)//如果不是unicode码则原样返回
return str;
StringBuffer sb = new StringBuffer(1000);
for (int i = 0; i < str.length() – 6;)
{
String strTemp = str.substring(i, i + 6);
String value = strTemp.substring(2);
int c = 0;
for (int j = 0; j < value.length(); j++)
{
char tempChar = value.charAt(j);
int t = 0;
switch (tempChar)
{
case ‘a’:
t = 10;
break;
case ‘b’:
t = 11;
break;
case ‘c’:
t = 12;
break;
case ‘d’:
t = 13;
break;
case ‘e’:
t = 14;
break;
case ‘f’:
t = 15;
break;
default:
t = tempChar – 48;
break;
}
c += t * ((int) Math.pow(16, (value.length() – j – 1)));
}
sb.append((char) c);
i = i + 6;
}
return sb.toString();
}
全部回答
1楼你哪知我潦倒为你
2021-01-19 05:48
short太短了,unicode码太长,你应该用int数组来存,就没有问题了
2楼三虚那逝的流年
2021-01-19 04:26
short是16位,char也是16位,这个不大可能会有问题吧,况且符号位只有一位,值只能是0或1,即使是这样,也根本不会影响到char的取值,你最好把代码发过来,我可以帮你看看
写了一个程序证明我的推断,结果表明是没有问题的,用short存unicode
String a = “用户名或密码错误”;
char[] b = a.toCharArray();
short[] c = new short[b.length];
for(int i=0;i
{
c[i] = (short)b[i];
}
char[] d = new char[b.length];
for(int i=0;i
{
d[i] = (char)c[i];
}
3楼冷月花魂
2021-01-19 04:04
只能一个个处理:
char[] charArray = new char[shortArray.length];
for (int i=0;i
charArray[i] = (char)shortArray[i];
}
String str = new String(charArray);
不过为什么要用short来存unicode字符?java的char本身就是无符号的,用于保存unicode字符的,相当于C中的w_char,而不仅仅只有0~255而已。
所以用short数组来保存字符根本就是错误的。
我要举报
如果感觉以上信息为低俗/不良/侵权的信息,可以点下面链接进行举报,我们会做出相应处理,感谢你的支持!
点此我要举报以上信息!
推荐资讯
大家都在看
今天的文章java 处理unicode_java处理unicode字符分享到此就结束了,感谢您的阅读,如果确实帮到您,您可以动动手指转发给其他人。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/26609.html