A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

概述:
        HBase是一个开源的非关系型分布式数据库。
        它是Apache软件基金会的Hadoop项目的一部分,并运行于HDFS文件系统之上

优点:
        HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,可以容错地存储海量稀疏的数据

用途:
        用来存储非结构化和半结构化的松散数据

扩展:
        1. Hadoop已经有了HDFS和MapReduce,为什么需要HBase?

                Hadoop可以很好地解决大规模数据的离线批量处理问题,
                但是,受限于HadoopMapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求。
       
        2. HBase与传统的关系数据库的区别主要体现在以下几个方面:

                数据类型、 数据操作、 存储模式、 数据索引、 数据维护、 可伸缩性

        3. Hbase的实现原理包括三个主要的功能组件:

                库函数(链接到每个客户端)
                一个Master主服务器
                许多个Region服务器

        4. 为什么在Hbase之上构建SQL引擎

                NoSQL区别于关系型数据库的一点就是NoSQL不使用SQL作为查询语言,
                至于为何在NoSQL数据存储HBase上提供SQL接口,有如下原因:
                        易使用、 减少编码

        5. 构建Hbase二级索引
                HBase只有一个针对行键的索引,访问Hbase表中的行,只有三种方式:

                        通过单个行键访问
                        通过一个行键的区间来访问
                        全表扫描

0 个回复

您需要登录后才可以回帖 登录 | 加入黑马