一、培训收益
通过此次课程培训,可使学习者获得如下收益:
1.深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势;
2.了解业界市场需求和国内外的大数据技术潮流,洞察大数据的潜在价值;
3.理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考;
4.掌握业界最流行的Hadoop与Spark大数据技术体系;
5.掌握大数据采集技术;
6.掌握大数据分布式存储技术;
7.掌握NoSQL与NewSQL分布式数据库技术;
8.掌握大数据仓库与统计机器学习技术;
9.掌握大数据分析挖掘与商业智能(BI)技术;
10.掌握大数据离线处理技术;
11.掌握Storm流式大数据处理技术;
12.掌握基于内存计算的大数据实时处理技术;
13.掌握大数据管理技术的原理知识和应用实战;
14.深入理解大数据平台技术架构和使用场景;
15.娴熟运用Hadoop与Spark大数据技术体系规划解决方案满足实际项目需求;
16.熟练地掌握基于Hadoop与Spark大数据平台进行应用程序开发、集群运维管理和性能调优技巧。
二、培训特色
1.课程培训业界最流行、应用最广泛的Hadoop与Spark大数据技术体系。强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及Hadoop与Spark大数据项目应用开发与调优的全过程沙盘模拟实战。
2.通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖Hadoop与Spark生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解Hadoop与Spark大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本技术与业务素养。
3.本课程的授课师资都是有着多年在一线从事Hadoop与Spark大数据项目的资深讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的应用开发、技术讨论与交流咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识体系,以及大数据技术应用实战技能,具备实际大数据应用项目的动手开发实践与运维管理部署能力。授课过程中,根据学员需求,增设交流环节,可将具体工作中遇到的实际问题展开讨论,讲师会根据学员的实际情况微调授课内容,由讲师带着全部学员积极讨论,并给出一定的时间让学员上台发言,现场剖析问题的症结,规划出可行的解决方案。
三、日程安排
第一天 上午 大数据技术基础
1.大数据的产生背景与发展历程
2.大数据的4V特征,以及与云计算的关系
3.大数据应用需求以及潜在价值分析
4.业界好的大数据技术发展态势与应用趋势
5.大数据思维的转变
6.大数据项目的系统与技术选型,及落地实施的挑战
7.“互联网+”时代下的电子商务、制造业、交通行业、电信运营商、银行金融业、电子政务、移动互联网、教育信息化等行业应用实践与应用案例介绍
业界主流的大数据技术方案
1.大数据软硬件系统全栈与关键技术介绍
2.大数据生态系统全景图
3.主流的大数据解决方案介绍
4.Apache大数据平台方案剖析
5.CDH大数据平台方案剖析
6.HDP大数据平台方案剖析
7.基于云的大数据平台方案剖析
8.大数据解决方案与传统数据库方案比较
9.国内外大数据平台方案与厂商对比
第二天 上午 Hadoop框架与生态发展,以及应用实践操作
1.Hadoop的发展历程
2.Hadoop 1.0的核心组件JobTracker,TaskTracker,以及适用范围
3.Hadoop 2.0的核心组件YARN工作原理,以及与Hadoop 1.0的联系与区别
4.Hadoop关键机制:任务推测执行,任务容错,任务选择执行,心跳机制
5.Hadoop YARN的资源管理与作业调度机制:FIFO调度,Capacity调度器,Fair调度器
6.Hadoop 常用参数调优与性能优化技术
第三天 上午 大数据计算模型(三)——流处理Storm, SparkStreaming
1.流数据处理应用场景与流数据处理的特点
2.流数据处理工具Storm的平台架构与集群工作原理
3.Storm关键技术与并发机制
4.Storm编程模型与基本开发模式
5.Storm数据流分组
6.Storm可靠性保证与Acker机制
7.Storm应用案例分析
8.流数据处理工具Spark Streaming基本概念与数据模型
9.SparkStreaming工作机制
10.SparkStreaming程序开发介绍
11.SparkStreaming的全局统计和窗口函数
12.Storm与SparkStreaming的对比
13.SparkStreaming开发案例:基于文件流的SparkStreaming程序开发;基于socket消息的SparkStreaming程序开发