2026年转换字符串编码(转换字符串编码怎么写)

转换字符串编码(转换字符串编码怎么写)原文地址 https blog csdn net h12kjgj article details 字符串在 java 中统一用 unicode 表示 即 utf 16 LE 对于 String s 你好哦 如果源码文件是 GBK 编码 操作系统 windows 默认的环境编码为 GBK 那么编译时 JVM 将 按照 GBK 编码将字节数组解析成字符



原文地址:https://blog.csdn.net/h12kjgj/article/details/

如果源码文件是GBK编码, 操作系统(windows)默认的环境编码为GBK,那么编译时, JVM将 按照GBK编码将字节数组解析成字符,然后将字符转换为unicode格式的字节数组,作为内部存储。

当打印这个字符串时,JVM 根据操作系统本地的语言环境,将unicode转换为GBK,然后操作系统将GBK格式的内容显示出来。

当源码文件是UTF-8, 我们需要通知编译器源码的格式,javac -encoding utf-8 … , 编译时,JVM按照utf-8 解析成字符,然后转换为unicode格式的字节数组, 那么不论源码文件是什么格式,同样的字符串,最后得到的unicode字节数组是完全一致的,显示的时候,也是转成GBK来显示(跟OS环境有关)

本质上都是由于字符串原本的编码格式 读取时解析用的编码格式 不一致导致的。
例如:

 
  

输出:

 
  

其中 getBytes() 是将unicode 转换为操作系统默认的格式的字节数组,即"你好哦"的 GBK格式。

new String (bytes, Charset) 中的charset 是指定读取 bytes 的方式,这里指定为UTF-8,即把bytes的内容当做UTF-8 格式对待。

如下两种方式都会有正确的结果,因为他们的源内容编码和解析用的编码是一致的。

 
  

则 new String(s.getBytes(“iso-8859-1”) ,“GBK”) 就可以正确解码了。 所以说这是一种巧合。

 
  

简化后就是:

 
  
 
  

Encodes this String into a sequence of bytes using the named charset, storing the result into a new byte array.

今天的文章 2026年转换字符串编码(转换字符串编码怎么写)分享到此就结束了,感谢您的阅读。
编程小号
上一篇 2025-08-04 14:33
下一篇 2025-03-27 13:17

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ri-ji/57199.html