还是统计单词,例如统计《莎士比亚全集》。 第一阶段 split:假设这个文件太大了,有400MB,首先做切片,因为是存储在HDFS上的,所以可以默认分成4块(默认每块是128M),就像图中的split 0 - 3,虽然这4个分片的物理位置分布在多个HDFS节点上,但我们不需要关心(交给框架)。 第二阶段 map:就是把单词转换成 Key,Value对...
头歌Hive综合应用案例 用户搜索日志分析2018年点击量最高的10个网站域名 头歌hadoop,vimhadoop-env.shexportJAVA_HOME=/app/jdk1.8.0_171vimyarn-env.shexportJAVA_HOME=/app/jdk1.8.0_171>>**又一大波vim飘过~~~**>>>**插入的内容放在两个<configurati