《实战大数据(Hadoop+Spark+Flink)——从平台构建到交互式数据分析(离线/实时)》详细介绍了大数据工程师在实际工作中应该熟练掌握的大数据技术。全书共8章,分别是大数据技术概述、搭建IDEA开发环境及Linux虚拟机、基于Hadoop构建大数据平台、基于HBase和Kafka构建海量数据存储与交换系统、用户行为离线分析—构建日志采集和分...
Flume是Cloudera开发的一个分布式、可靠、高可用的系统,它能够将不同数据源的海量日志数据进行高效收集、聚合、移动,最后存储到一个中心化的数据存储系统中。随着互联网的发展,特别是移动互联网的兴起,产生了海量的用户日志信息,为了实时分析和挖掘用户需求,需要使用Flume高效快速地采集用户日志,同时对日志进行聚合,避免小...
大数据平台通常是构建在Linux系统之上的,而大家平时使用的计算机大部分是Windows系统。此时可以通过VMware Workstation虚拟化软件在Windows系统中安装虚拟机,然后在虚拟机上安装Linux操作系统,这样大数据平台就可以构建在Linux虚拟机之上(生产环境中,公司可以购买物理服务器搭建大数据平台)。读者可通过以下教学视频学习在虚拟机上...
Flink和Spark都能对接大部分比较常用的系统,即使有些系统暂时还不支持,也可以自定义开发Connectors来支持不同的系统。Flink与Spark支持的Connectors如图7-4所示。 图7-4 Flink与Spark对Connectors支持的对比 a) Flink对Connectors的支持 b) Spark对Connectors的支持 (4)运行环境 Flink与Spark都能部署到目前的主流环境中...
前面的工作一切就绪,接下来使用IDEA开发工具构建Maven项目。图2-23 配置Maven安装路径1)打开IDEA欢迎界面,选择Create New Project选项创建新项目,如图2-24所示。2)在弹出的界面中左侧选择Maven,右侧选择Project SDK,下面勾选Create from archetype,并选择maven-archetype-quickstart骨架创建Maven项目,具体操作如图2-25所示...
大数据与云计算 > 机工出版 > 实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 大数据 分布式 数据分析 数据可视化 实时 离线 机械工业出版社京东自营官方旗舰店 实战大数据(Hadoop+Spark+Flink)从平台构建... 杨俊著 京东价 ¥
计算机与互联网 > 数据库 > 孩童王国 > 实战大数据 Hadoop+Spark+Flink从平台构建到交互式数据分析离线 实时 讲透大数据平台的搭建及数据分析 更全面更深入更前沿 温州富庶电子商务图书店 关注店铺 评分详细 商品评价: 4.0 低 物流履约: 3.7 低 售后服务: ...
《实战大数据(Hadoop+Spark+Flink):从平台构建到交互式数据分析(离线.实时)》_杨俊_1.3 大数据工程师的技能树_掌阅小说网
当当网图书频道在线销售正版《实战大数据(Hadoop+Spark+Flink)——从平台构建到交互式数据分析(离线/实时)》,作者:杨俊,出版社:机械工业出版社。最新《实战大数据(Hadoop+Spark+Flink)——从平台构建到交互式数据分析(离线/实时)》简介、书评、试读、价格、图片
面向大数据开发工程师,大数据运维工程师 围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时) 随书配备全套数据集、安装包、配置文件、海量教学视频(近30GB),方便学用 售价:¥69.90 纸质售价:¥54.50购买纸书 335人正在读 |0人评论 ...