[学习交流] 【广州python】b+树的原理

索引提高查询效率的原理：降低磁盘IO
innodb引擎索引以B+树的方式存储：
1，B+树是的多路平衡树，最多可以开m个叉（m>=2），除了根之外的每个节点都包含最少个元素最多个元m素，我们称之为m阶b树，B+树含之所以含多阶，通过最大化在每个内部节点内的子节点的数目减少树的高度，因为树的深度越高，查询速度越慢，B+ 树不需要像其他自平衡二叉查找树那样经常的重新平衡。
2，平衡树为树的高度差小于等于1的树，比较均匀，不会出现某个枝干深度特别大。
3，B+Tree 在 B-Tree 数据结构的基础上做了很小的改造，在每一个 Leaf Node 上面出了存放索引键的相关信息之外，还存储了指向与该 Leaf Node 相邻的后一个 LeafNode 的指针信息，这主要是为了加快检索多个相邻 Leaf Node 的效率考虑。
4，B-Tree结构图中可以看到每个节点中不仅包含数据的key值，还有data值。而每一个页的存储空间是有限的，如果data数据较大时将会导致每个节点（即一个页）能存储的key的数量很小，当存储的数据量很大时同样会导致B-Tree的深度较大，增大查询时的磁盘I/O次数，进而影响查询效率。在B+Tree中，所有数据记录节点都是按照键值大小顺序存放在同一层的叶子节点上，而非叶子节点上只存储key值信息，这样可以大大加大每个节点存储的key值数量，降低B+Tree的高度。
数据库中的B+Tree索引可以分为聚集索引（clustered index）和辅助索引（secondary index）。上面的B+Tree示例图在数据库中的实现即为聚集索引，聚集索引的B+Tree中的叶子节点存放的是整张表的行记录数据。辅助索引与聚集索引的区别在于辅助索引的叶子节点并不包含行记录的全部数据，而是存储相应行数据的聚集索引键，即主键。当通过辅助索引来查询数据时，InnoDB存储引擎会遍历辅助索引找到主键，然后再通过主键在聚集索引中找到完整的行记录数据。

b+树索引过程
查找
查找以典型的方式进行，类似于二叉查找树。起始于根节点，自顶向下遍历树，选择其分离值在要查找值的任意一边的子指针。在节点内部典型的使用是二分查找来确定这个位置。
插入
节点要处于违规状态，它必须包含在可接受范围之外数目的元素。
1.首先，查找要插入其中的节点的位置。接着把值插入这个节点中。
2.如果没有节点处于违规状态则处理结束。
3.如果某个节点有过多元素，则把它分裂为两个节点，每个都有最小数目的元素。在树上递归向上继续这个处理直到到达根节点，如果根节点被分裂，则创建一个新根节点。为了使它工作，元素的最小和最大数目典型的必须选择为使最小数不小于最大数的一半。
删除
1.首先，查找要删除的值。接着从包含它的节点中删除这个值。
2.如果没有节点处于违规状态则处理结束。
3.如果节点处于违规状态则有两种可能情况：

lmb · lmb

学习学习

帐号		自动登录	找回密码
密码			加入黑马

[学习交流] 【广州python】b+树的原理

1 个回复

浏览过的版块

新人专属

QQ达人