字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题。由于计算机是美国人发明的。 因此,最早只有127个字母被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被 称为"ASCII"编码,比如大写字母A的编码是65,小写字母z的编码是122。 但是要处理中文显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突, 所以,中国制定了GB2312编码,用来把中文编进去。可是世界除了英语和中文之外,还 有很多语言。因此,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。 在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候, 就转换为UTF-8编码。用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里, 编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:在最新的Python 3.X版本中, 字符串是以Unicode编码的,也就是说,Python的字符串支持多语言;需要注意的是,在2.X版本里,需要加一行注释,否则python2会默认使用ASCII编码。 在3.X版本的python中,简化了输入的语法,输出的(print)被内置成了函数,所以函数后边要有参数传进来>> print(name),个人觉得这两个版本的差别只有个别地方的不同,用到时稍微注意下就可以了(习惯问题就只能酸爽的呵呵了)。 |