合并(merge)会将所有溢出文件合并在一起以确保最终一个maptask对应一个输出结果文件。 一次最多可以合并文件个数由mapreduce.task.io.sort.factor指定,默认10。如果超过将进行多次merge合并。 合并之后的结果还包含索引文件,索引文件描述了数据中分区范围信息,以便reducetask能够轻松获取与其相关的分区数据。 (5)Combiner...