黑马程序员技术交流社区
标题:
汉字在不同编码表中占的字节数是多少
[打印本页]
作者:
高波
时间:
2013-8-5 23:18
标题:
汉字在不同编码表中占的字节数是多少
本帖最后由 杨兴庭 于 2013-8-6 21:16 编辑
毕老师在第19天《流操作规律-2》中,讲到同一汉字在不同编码表中编码不同时,毕老师打开一个6个字节的GBK文件,文件内容:你好 毕老师说一个汉字是3个字节。 文件中除了汉字还有一个回车符的,应该占两个字节,所以两个汉字占4个字节,一个汉字在GBK编码表中占2个字节。
是毕老师说错了,还是我哪里理解的不对,大婶们给个指点,谢谢。
PS:最好嫩把汉字在其他编码表中占的字节数也说下。
作者:
逆袭的风
时间:
2013-8-5 23:27
没错的话应该是这样的::
GBK编码下,一个汉字占2个字节;
UTF-8编码下,一个汉字占3个字节
UTF-8是一种国际通用的一种变长编码,ASCII对应的字符在UTF-8下占1个字符,西方文字(希腊文字)占2个字符,中文占用3个字节数,还有平面符号占4个字节
作者:
杨增坤
时间:
2013-8-6 15:20
GBK编码下,一个汉字占2个字节;
UTF-8编码下,一个汉字占3个字节
老师那个文件中写后,没有按回车键,如果按了就按你的思路理解,但是总字节会变的。
这两个方式的所占字节数是不一样的,你可以看光标的位置来判断
希望对你有帮助!
1.png
(5.37 KB, 下载次数: 5)
下载附件
2013-8-6 15:19 上传
没按回车键
2.png
(4.9 KB, 下载次数: 7)
下载附件
2013-8-6 15:19 上传
按回车键了
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2