《实战大数据(Hadoop+Spark+Flink)——从平台构建到交互式数据分析(离线/实时)》详细介绍了大数据工程师在实际工作中应该熟练掌握的大数据技术。全书共8章,分别是大数据技术概述、搭建IDEA开发环境及Linux虚拟机、基于Hadoop构建大数据平台、基于HBase和Kafka构建海量数据存储与交换系统、用户行为离线分析—构建日志采集和分...
Flume是Cloudera开发的一个分布式、可靠、高可用的系统,它能够将不同数据源的海量日志数据进行高效收集、聚合、移动,最后存储到一个中心化的数据存储系统中。随着互联网的发展,特别是移动互联网的兴起,产生了海量的用户日志信息,为了实时分析和挖掘用户需求,需要使用Flume高效快速地采集用户日志,同时对日志进行聚合,避免小...
大数据平台通常是构建在Linux系统之上的,而大家平时使用的计算机大部分是Windows系统。此时可以通过VMware Workstation虚拟化软件在Windows系统中安装虚拟机,然后在虚拟机上安装Linux操作系统,这样大数据平台就可以构建在Linux虚拟机之上(生产环境中,公司可以购买物理服务器搭建大数据平台)。读者可通过以下教学视频学习在虚拟机上...
Flink和Spark都能对接大部分比较常用的系统,即使有些系统暂时还不支持,也可以自定义开发Connectors来支持不同的系统。Flink与Spark支持的Connectors如图7-4所示。 图7-4 Flink与Spark对Connectors支持的对比 a) Flink对Connectors的支持 b) Spark对Connectors的支持 (4)运行环境 Flink与Spark都能部署到目前的主流环境中...
前面的工作一切就绪,接下来使用IDEA开发工具构建Maven项目。图2-23 配置Maven安装路径1)打开IDEA欢迎界面,选择Create New Project选项创建新项目,如图2-24所示。2)在弹出的界面中左侧选择Maven,右侧选择Project SDK,下面勾选Create from archetype,并选择maven-archetype-quickstart骨架创建Maven项目,具体操作如图2-25所示...
计算机与互联网 > 数据库 > 孩童王国 > 实战大数据 Hadoop+Spark+Flink从平台构建到交互式数据分析离线 实时 讲透大数据平台的搭建及数据分析 更全面更深入更前沿 温州富庶电子商务图书店 关注店铺 评分详细 商品评价: 4.0 低 物流履约: 3.7 低 售后服务: ...
《实战大数据(Hadoop+Spark+Flink) 从平台构建到交互式数据分析(离线/实时)》,作者:实战大数据(Hadoop+Spark+Flink) 从平台构建到交互式数据分析(离线/实时)无著,出版社:机械工业出版社,ISBN:9787111679660。面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark
共包含7个章节内容,1至3章主要学习大数据集群搭建,解决大数据项目发环境和运行环境问题,第4章主要学习HBase数据库和Kafka消息队列,解决了大数据的存储和交换问题,第5、6章主要学习大数据项目离线分析和实时分析,解决了大数据的计算问题,第7章主要学习Web技术发,解决了大数据可视化问题。 本书主要读者对象为大数据发工程...
当当网图书频道在线销售正版《实战大数据(Hadoop+Spark+Flink)——从平台构建到交互式数据分析(离线/实时)》,作者:杨俊,出版社:机械工业出版社。最新《实战大数据(Hadoop+Spark+Flink)——从平台构建到交互式数据分析(离线/实时)》简介、书评、试读、价格、图片
实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 大数据 分布式 数据分析 数据可视化 实时 离线 杨俊著 京东价 ¥降价通知 累计评价 0 促销 展开促销 配送至 --请选择-- 支持 选择商品系列 实战大数据 Python机器学习 实战大数据 分布式 ...