A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 高波 中级黑马   /  2013-8-5 23:18  /  1845 人查看  /  2 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

本帖最后由 杨兴庭 于 2013-8-6 21:16 编辑

毕老师在第19天《流操作规律-2》中,讲到同一汉字在不同编码表中编码不同时,毕老师打开一个6个字节的GBK文件,文件内容:你好  毕老师说一个汉字是3个字节。 文件中除了汉字还有一个回车符的,应该占两个字节,所以两个汉字占4个字节,一个汉字在GBK编码表中占2个字节。
是毕老师说错了,还是我哪里理解的不对,大婶们给个指点,谢谢。
PS:最好嫩把汉字在其他编码表中占的字节数也说下。

评分

参与人数 1黑马币 +3 收起 理由
杨兴庭 + 3 赞一个!

查看全部评分

2 个回复

倒序浏览
没错的话应该是这样的::

GBK编码下,一个汉字占2个字节;
UTF-8编码下,一个汉字占3个字节
UTF-8是一种国际通用的一种变长编码,ASCII对应的字符在UTF-8下占1个字符,西方文字(希腊文字)占2个字符,中文占用3个字节数,还有平面符号占4个字节

评分

参与人数 1技术分 +1 收起 理由
杨兴庭 + 1

查看全部评分

回复 使用道具 举报
GBK编码下,一个汉字占2个字节;
UTF-8编码下,一个汉字占3个字节
老师那个文件中写后,没有按回车键,如果按了就按你的思路理解,但是总字节会变的。

这两个方式的所占字节数是不一样的,你可以看光标的位置来判断
希望对你有帮助!


1.png (5.37 KB, 下载次数: 6)

没按回车键

没按回车键

2.png (4.9 KB, 下载次数: 10)

按回车键了

按回车键了

评分

参与人数 1技术分 +1 收起 理由
杨兴庭 + 1

查看全部评分

回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马