黑马程序员技术交流社区

标题: 【广州校区】【原创】HBase概述及扩展 [打印本页]

作者: 帅气de路人甲    时间: 2020-2-20 12:57
标题: 【广州校区】【原创】HBase概述及扩展
概述:
        HBase是一个开源的非关系型分布式数据库。
        它是Apache软件基金会的Hadoop项目的一部分,并运行于HDFS文件系统之上

优点:
        HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,可以容错地存储海量稀疏的数据

用途:
        用来存储非结构化和半结构化的松散数据

扩展:
        1. Hadoop已经有了HDFS和MapReduce,为什么需要HBase?

                Hadoop可以很好地解决大规模数据的离线批量处理问题,
                但是,受限于HadoopMapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求。
       
        2. HBase与传统的关系数据库的区别主要体现在以下几个方面:

                数据类型、 数据操作、 存储模式、 数据索引、 数据维护、 可伸缩性

        3. Hbase的实现原理包括三个主要的功能组件:

                库函数(链接到每个客户端)
                一个Master主服务器
                许多个Region服务器

        4. 为什么在Hbase之上构建SQL引擎

                NoSQL区别于关系型数据库的一点就是NoSQL不使用SQL作为查询语言,
                至于为何在NoSQL数据存储HBase上提供SQL接口,有如下原因:
                        易使用、 减少编码

        5. 构建Hbase二级索引
                HBase只有一个针对行键的索引,访问Hbase表中的行,只有三种方式:

                        通过单个行键访问
                        通过一个行键的区间来访问
                        全表扫描






欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2