1、架构大数据:挑战、现状与展望 主要对Map Reduce进行介绍 Map Reduce是2004年由Google提出的面向大数据集处理的编程模型,起初 主要用作互联网数据的处理,例如文档抓取、倒排索引的建立等。但由于其简单 而强大的数据处理接口和对大规模并行执行、容错及负载均衡等实现细节的隐 藏,该技术一经推出便迅速在机器学习、 ...
架构大数据_挑战_现状与展望_王珊
架构大数据:挑战、现状与展望(上) 摘要:大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点,为了设计适合大数据分析的数据仓库架构,文中列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台———并行数据库、MapReduce及基于两者的混合架构进行了分析归纳,指出了各自的优势及不足,同时...
第34卷第1O期2011年1O月计算机学报CHINESEJOURNALOFCOMPUTERSVo1.34NO.10Oct.2O11架构大数据:挑战、现状与展望王珊”王会举”’覃雄派”周(数据工程与知识工程教育部重点实验室(中国人民大学)北京(中国人民大学信息学院北京100872)摘要大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大...
第34卷第1O期2011年1O月计算机学报CHINESEJOURNALOFCOMPUTERSVo1.34NO.10Oct.2O11架构大数据:挑战、现状与展望王珊”王会举”’覃雄派”周(数据工程与知识工程教育部重点实验室(中国人民大学)北京(中国人民大学信息学院北京100872)摘要大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大...