黑马程序员技术交流社区

标题: 汉字在不同编码表中占的字节数是多少 [打印本页]

作者: 高波    时间: 2013-8-5 23:18
标题: 汉字在不同编码表中占的字节数是多少
本帖最后由 杨兴庭 于 2013-8-6 21:16 编辑

毕老师在第19天《流操作规律-2》中,讲到同一汉字在不同编码表中编码不同时,毕老师打开一个6个字节的GBK文件,文件内容:你好  毕老师说一个汉字是3个字节。 文件中除了汉字还有一个回车符的,应该占两个字节,所以两个汉字占4个字节,一个汉字在GBK编码表中占2个字节。
是毕老师说错了,还是我哪里理解的不对,大婶们给个指点,谢谢。
PS:最好嫩把汉字在其他编码表中占的字节数也说下。
作者: 逆袭的风    时间: 2013-8-5 23:27
没错的话应该是这样的::

GBK编码下,一个汉字占2个字节;
UTF-8编码下,一个汉字占3个字节
UTF-8是一种国际通用的一种变长编码,ASCII对应的字符在UTF-8下占1个字符,西方文字(希腊文字)占2个字符,中文占用3个字节数,还有平面符号占4个字节
作者: 杨增坤    时间: 2013-8-6 15:20
GBK编码下,一个汉字占2个字节;
UTF-8编码下,一个汉字占3个字节
老师那个文件中写后,没有按回车键,如果按了就按你的思路理解,但是总字节会变的。

这两个方式的所占字节数是不一样的,你可以看光标的位置来判断
希望对你有帮助!


1.png (5.37 KB, 下载次数: 6)

没按回车键

没按回车键

2.png (4.9 KB, 下载次数: 10)

按回车键了

按回车键了





欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2