A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

孙航

初级黑马

  • 黑马币:

  • 帖子:

  • 精华:

© 孙航 初级黑马   /  2018-8-2 19:35  /  844 人查看  /  1 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题。由于计算机是美国人发明的。
因此,最早只有127个字母被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被
称为"ASCII"编码,比如大写字母A的编码是65,小写字母z的编码是122。
但是要处理中文显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突,
所以,中国制定了GB2312编码,用来把中文编进去。可是世界除了英语和中文之外,还
有很多语言。因此,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,
就转换为UTF-8编码。用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,
编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:在最新的Python 3.X版本中,
字符串是以Unicode编码的,也就是说,Python的字符串支持多语言;需要注意的是,在2.X版本里,需要加一行注释,否则python2会默认使用ASCII编码。
         在3.X版本的python中,简化了输入的语法,输出的(print)被内置成了函数,所以函数后边要有参数传进来>> print(name),个人觉得这两个版本的差别只有个别地方的不同,用到时稍微注意下就可以了(习惯问题就只能酸爽的呵呵了)。

1 个回复

倒序浏览
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马