A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 别问我是谁 中级黑马   /  2014-7-25 12:25  /  1514 人查看  /  3 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

本帖最后由 别问我是谁 于 2014-7-26 20:45 编辑

ANSI,Unicode,Unicode big endian 以及utf-8四种不同的记事本编码格式,,,求几者之间的详细区别,及进行读、写操作时的用法

评分

参与人数 1技术分 +1 收起 理由
陈君 + 1

查看全部评分

3 个回复

倒序浏览
本帖最后由 许庭洲 于 2014-7-26 21:16 编辑

1.ANSI(American National Standards Institute): 它使用7 bits来表示一个字符,总共表示128个字符,其中包括了英文字母、数字、标点符号等常用字符。
2.Unicode: 它固定使用16 bits(两个字节、一个字)来表示一个字符,共可以表示65536个字符。
3.Unicode big endian :字节序分为Big Endian字节序和Little Endian字节序。
  例如,0X09CD
  Big Endian字节序
  0000: 0 9
  0001: CD
  Little Endian字节序是
  0000: CD
  0001: 0 9
4.utf-8: UTF意为通用字集转换格式(Universal Character Set TransformationFormat),UTF-8是Unicode的8位元格式。采用变长字节 (1 ASCII, 2 希腊字母, 3 汉字, 4 平面符号) 表示,网络传输, 即使错了一个字节,不影响其他字节,而双字节只要一个错了,其他也错。

评分

参与人数 1技术分 +1 收起 理由
陈君 + 1

查看全部评分

回复 使用道具 举报
路过学习了!
回复 使用道具 举报
许庭洲 发表于 2014-7-25 13:28
1.ANSI(American National Standards Institute): 它使用7 bits来表示一个字符,总共表示128个字符,其中包 ...

恩嗯,很好。。受教了
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马