最近由于对乱码这方面的关注比较多,所以打算结合资料说一下对这方面的总结
其实最开始对编码与解码这方面一直了解的不是很清楚,常常处于一种知其然而不知其所以然的状态,可能这也是自己错误的学习方式导致的结果
我们知道计算机的发明者是美国的大佬们,从计算机出现的那天起关于编码的问题也就伴随着出现了。因为计算机中只可以存储0-1形式的机器码,对于编程人员来说,用0-1这种机器码去写程序显然是很不友好的,于是就出现了编程语言,编程语言是一些我们可以看懂的字符,它极大的解放了编程人员,但是另一方面对人类友好也就意味着对机器不友好,计算机是不认识这些字符的,所以自然而然编码和解码就登上了历史的舞台。
最先出现的编码格式是ASCII码,这种编码规则是美国人制定的,大致的规则是用一个字节(8个bit)去表示出现的字符,其实由于在老美的世界里中总共出现的字符也不超过128个,而一个字节能够表示256种字符,所以当时这种编码的方式是没有问题的。
很多人在这里有个误会,就是容易把Bytes和编程语言里的其它数据类型混淆,其实Bytes才是计算机里真正的数据类型,也是网络数据传输中唯一的数据格式, |
|