Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。它是一个能够对大量数据进行分布式处理的软件框架,并以一种可靠、高效、可伸缩的方式进行数据处理,用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算。
HBase是一个分布式的、面向列的开源数据库,是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。HBase中的所有数据文件都存储在Hadoop HDFS文件系统上。 |