MapReduce是一个分布式运算程序的编程框架,是基于Hadoop的数据分析计算的核心框架。 MapReduece处理过程分为两个阶段:Map和Reduce。 Map复测把一个任务分解成多个任务, Reduce负责把分解后多任务处理的结果汇总。 优点: MapReduce易于编程(它可以简单的实现一些接口,就可以完成一个分布式程序) 良好的扩展性 高容错性 ...