HDFS:分布式文件系统,运行于大型商用机集群; Pig:一种数据流语言和运行环境,用以检索非常大的数据集; Hive:一个分布式、按列存储的数据仓库,管理HDFS中存储的数据,并提供基于SQL的查询语句用以查询数据; HBase:一个分布式、按列存储数据库,使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询(随机读取); ...