黑马程序员技术交流社区

标题: 求详解四种编码格式的区别及使用 [打印本页]

作者: 别问我是谁    时间: 2014-7-25 12:25
标题: 求详解四种编码格式的区别及使用
本帖最后由 别问我是谁 于 2014-7-26 20:45 编辑

ANSI,Unicode,Unicode big endian 以及utf-8四种不同的记事本编码格式,,,求几者之间的详细区别,及进行读、写操作时的用法

作者: 许庭洲    时间: 2014-7-25 13:28
本帖最后由 许庭洲 于 2014-7-26 21:16 编辑

1.ANSI(American National Standards Institute): 它使用7 bits来表示一个字符,总共表示128个字符,其中包括了英文字母、数字、标点符号等常用字符。
2.Unicode: 它固定使用16 bits(两个字节、一个字)来表示一个字符,共可以表示65536个字符。
3.Unicode big endian :字节序分为Big Endian字节序和Little Endian字节序。
  例如,0X09CD
  Big Endian字节序
  0000: 0 9
  0001: CD
  Little Endian字节序是
  0000: CD
  0001: 0 9
4.utf-8: UTF意为通用字集转换格式(Universal Character Set TransformationFormat),UTF-8是Unicode的8位元格式。采用变长字节 (1 ASCII, 2 希腊字母, 3 汉字, 4 平面符号) 表示,网络传输, 即使错了一个字节,不影响其他字节,而双字节只要一个错了,其他也错。

作者: 麦田怪圈    时间: 2014-7-25 16:22
路过学习了!
作者: 别问我是谁    时间: 2014-7-26 20:44
许庭洲 发表于 2014-7-25 13:28
1.ANSI(American National Standards Institute): 它使用7 bits来表示一个字符,总共表示128个字符,其中包 ...

恩嗯,很好。。受教了




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2