数据处理 (1)raw data——>data cleaning——>feature 考虑:内存, 完成时间 例子word count (2)利用map-reduce思想完成大数据操作和处理 单台服务器内存不足,搭建服务器集群 map-reduce集群: (1)在多节点上冗余存储数据,以空间换稳定 (2)将计算(op/script)移向数...hadoop 的 map reduce实现(其一) 转载...