概述:
HBase是一个开源的非关系型分布式数据库。
它是Apache软件基金会的Hadoop项目的一部分,并运行于HDFS文件系统之上
优点:
HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,可以容错地存储海量稀疏的数据
用途:
用来存储非结构化和半结构化的松散数据
扩展:
1. Hadoop已经有了HDFS和MapReduce,为什么需要HBase?
Hadoop可以很好地解决大规模数据的离线批量处理问题,
但是,受限于HadoopMapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求。
2. HBase与传统的关系数据库的区别主要体现在以下几个方面:
数据类型、 数据操作、 存储模式、 数据索引、 数据维护、 可伸缩性
3. Hbase的实现原理包括三个主要的功能组件:
库函数(链接到每个客户端)
一个Master主服务器
许多个Region服务器
4. 为什么在Hbase之上构建SQL引擎
NoSQL区别于关系型数据库的一点就是NoSQL不使用SQL作为查询语言,
至于为何在NoSQL数据存储HBase上提供SQL接口,有如下原因:
易使用、 减少编码
5. 构建Hbase二级索引
HBase只有一个针对行键的索引,访问Hbase表中的行,只有三种方式:
通过单个行键访问
通过一个行键的区间来访问
全表扫描
|
|