A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© Eagle 高级黑马   /  2014-11-12 08:33  /  1760 人查看  /  3 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

UTF-8修改版获取编码字节数是根据字节头来获取的。
UTF-8修改版编码字节获取方式如下:
第一个字节是0开头,是读一个字节,例如:01101001
第一个字节是110 开头, 第二个字节是10开头。是读两个字节,例如:11001101   10101011
第一个字节是1110 开头, 第二个字节是10开头   第三个字节也是10开头。 是读三个字节,例如:11101010   10100101  10100101
但是如果碰上如下情况怎么读?
情况1:1111开头的字节,例如:11110101
情况2:第一个字节10开头的字节,例如:10010100
情况3:第一个字节110开头第二个字节不是10开头的字节,例如:11001100  01001001
情况4:第一个字节1110开头,第二个字节或第三个字节不是10开头的字节,例如:11100001   11001001  01101001
像以上情况的话,编码是怎么判断获取字节数的?
是还能获取呢?还是不能继续获取?
还是原来获取方式的话,是不是就是出现乱码呢?

评分

参与人数 1技术分 +1 收起 理由
杨佳名 + 1

查看全部评分

3 个回复

倒序浏览
那么这种情况,就不会进行读码,以不存在的字符进行处理
回复 使用道具 举报
zhangyangLengen 发表于 2014-11-12 08:48
那么这种情况,就不会进行读码,以不存在的字符进行处理

不是乱码吗?
回复 使用道具 举报
应该就是乱码
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马