java char 类型储存汉字

Mr_Kail 发布于 2014/11/08 19:17
阅读 585
收藏 2

背景

1. Java是可以储存一个汉字的。

2. char栈两个字节

3. UTF-8 编码的汉字是边长的,占2-4个字节。

那问题来了:

在使用Eclipse的工作空间的编码设置的都是Utf-8,文件编码应该是utf-8,这时候char储存的汉字编码有可能大于2,那么为什么不会出现问题,在编译的时候文件中的中文汉字都做了哪些变化? 或者说我这种思路完全是错误的,“java采用unicode,2个字节(16位)来表示一个字符, 无论是汉字还是数字字母,或其他语言”,总感觉这些零碎的东西就是串不起来,怎么把它系统的联系起来?


加载中
0
南湖船老大
南湖船老大

文件编码是文件编码。Java只有一种编码,那就是iso-88591。

0
xpbob
xpbob
java的汉字是2字节,这些都是jdk编译的,你说的utf8是文件的编码格式,不会因为他,编译器改变编译原理
0
有明丶
有明丶
Java编译时会根据编码设置先将代码里的各种格式的编码转化为unicode的,在编译后的程序里不存在编码不同的问题,所有的字符和字符串都是unicode编码的。
返回顶部
顶部