大家好,欢迎来到IT知识分享网。
Java中的char占用几个字节
一、概述
网上或书上都说是 Java 中的 char 占用 2 个字节,一直没有深入,直到接触了编码,才对此产生了疑问,今天来深入一下这个问题。
二、答疑
char 在设计之初的时候被用来存储字符,可是世界上那么多字符,如果有 1 个字节,就意味着只能存储 256(2^8)个字符,显然不合适,而如果用两个字节呢,那么就可以存储 65536(2^16)个字符,这个数量符合大多数国家的语言字符个数于是 Java 团队使用 unicode 作为编码,一个 char 作为 2 个字节来存储。
但是 unicode 只是一个标准,具体的实现还是有如:UTF-8 或 UTF-16 等编码。
Java 的默认编码是 UTF-8,可以通过Charset.defaultCharset();或System.getProperty(“file.encoding”)来获取,也可以在运行时指定 VM 参数 -Dfile.encoding=UTF-16来改变默认字符集。
1、Java 中的 char 一定是 2 个字节吗?
不一定,与我们使用的字符集有关系,如果使用 ASCII 编码集,那么 char 占用一个字节,如果使用 UTF-8 编码格式呢?UTF-8 是不定长编码,编码的长度是动态的,所以不一定。
2、Java 中的 char 能存储中文吗?
这个问题依旧归结于使用的编码集,如果使用ASCII,那肯定不能存储,如果采用UTF-8,那可以。
三、总结
char 的长度和是否能存储中文字符是和编码格式有关的。对于我们在编码的时候如果跨平台编码时,应该在编码、解码的时候设置对应的格式,防止由于编解码导致的异常。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/12937.html