黑马程序员技术交流社区

标题: 【上海校区】base16, base32, base64 编码讲解 [打印本页]

作者: 懒,羊羊    时间: 2019-7-19 09:48
标题: 【上海校区】base16, base32, base64 编码讲解
前言
相信超过绝大多少的程序员都曾在各种的软件开发中使用过编码、解码,编码和解码是对应的,有编码就有解码。
base16,base32,base64 都是编码方式,对应有各自的一套编码算法。
但是有人经常称它们是加密,例如 base64 加密。其实这种说法不算全对。因为默认的 base16,base32,base64 的各种信息都是公开的,公开的包含有:
在 base16,base32,base64 中,一旦掌握了上面两类信息,那么就相当于破解了。甚至可以手动用笔写出编码后的结果以及根据编码结果写出解码内容。

16,32和64它们编码原理都是一样的,不同的地方在于下面 2 东西:
上述两点是什么意思呢?
首先我们知道数据类型 char 一般占2个字节,当然还有二般的情况,比如1个字节,但这里我们以2字节为例,例如: char r = 'a',那么如果这种规则被修改了呢,既然可以使用2个字节表示一个字符,那么为什么不可以用3字节,5字节表示?当我们其它的字节个数表示一个字符的时候,就会产生其它效果。而,上述的第一点就是类似这个意思。当代表下标的 bit 位的个数变了,下标的取值范围也跟着变,比如 2 个 bit 位最大的数是 11 = 3,而 3 个 bit 位最大的数是 111 = 7 。
对于第二点来说,就是一个用来供查表的表格,例如9x9乘法表。这个表格是要被查询的。
编码流程当有了上述两点的条件后,我们将编码的流程总结为下面几点:
例如要被编码的字符串是:ILU
自定义表格代码中,我们可以指定自己的编码表,例如下面的一行:
var encoding = base32.NewEncoding("ybndrfg8ejkmcpqxot1uwisza345h769")复制代码ybndrfg8ejkmcpqxot1uwisza345h769 是 32 个字符,对应 base 32 编码,下标 0 对应的字符是 y
当上面的 ILU 例子用 该表格编码时,那么就不再是: 494C55
总结在上面的第3步,对于刚好能够整数划分的 (8 / 4 = 2 整除),是不会有出现在最终结果后面补充等于号"="符号的情况的,而不能除尽的,将会被补充为 "=" 。下面是 16,32和64的需要bit位个数和编码表的总字符
名称下标数字的位个数编码表字符串位数不足是否会补全 =
base 164数字0~9 和 字母 A~F不会,位数刚好是 4 的倍数
base 325大写字母A~Z 和 数字2~7会
base 646大写字母A~Z,小写字母a~z,数字0~9以及"+","/"会名称编码后,数据量变化
base 16由一个8位表示一个字符 变成 4位表示一个字符,数据量变 2 倍
base 32变为 8/5 倍
base 64变为 8/6=4/3 倍补全的限制,拿base32 来说,因为每5位表示一个字符下标值,而原始数据是8位,这就意味着,划分会出现剩下的情况,例如:8 - 5 = 3,明显有3个 bit 位剩下,那么至少要多少个位才能满足步出现剩下的呢?这是一个最小公倍数问题,就是: 5*8 = 40 位。我们可以验证一下,当两个字符的时候,是16位,16/5 = 1,以此类推。
最终,得出在 base32 的编码中,待编码数据至少要 >= 40 位,其最终的编码结果才能不出现 = 号。例如要被编码的字符是3,很明显,它的结果是:D=======,后面的 = 都是补全的。
同理,base64 的是至少 24 位,24 是 6 和 8 的最小公倍数。
上述,就是所有内容,记住此类编码方式的主要点:剩下的,就是照着模式走,划分、对表,得出结果。


链接:https://juejin.im/post/5c0a2407f265da611f0780c7
来源:掘金







欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2