课程目标

本课程以大数据架构与案例为驱动,采用一个完整地案例贯穿整个课程,让学员体验大数据架构的企业价值。在课程中学员将被赋予企业架构师角色,通过剖析企业对大数据的主要需求,使学员感悟大数据架构设计的过程与价值。具体课程目标包括:"> 大数据Hadoop与Spark技术架构与应用实战-中培IT学院
您现在的位置:首页 > 课程体系 > 大数据与人工智能 > 大数据系列
大数据Hadoop与Spark技术架构与应用实战
 

大数据HadoopSpark技术架构与应用实战

培训班的通知

20150628日至0630( 0627日全天报到) 上海

20150724日至0726( 0723日全天报到) 青岛

20150821日至0823( 0820日全天报到) 大连

20150923日至0925( 0922日全天报到) 北京

20151016日至1018( 1015日全天报到) 成都

20151127日至1129( 1126日全天报到) 深圳

20151224日至1226( 1223日全天报到) 广州

20160127日至0129( 0126日全天报到) 杭州

各有关单位:

根据国务院“互联网+”行动计划战略布局,为响应工业和信息化部培养云计算和大数据高端人才的号召,中国信息化培训中心特推出了大数据技术架构及应用实战课程培训班,通过专业的大数据HadoopSpark技术架构体系与业界真实案例来全面提升大数据工程师、开发设计人员的工作水平,旨在培养专业的大数据HadoopSpark技术架构专家,更好地服务于各个行业的大数据项目开发和落地实施。现将相关事宜通知如下:

一、     培训特色

课程培训业界最流行、应用最广泛的HadoopSpark大数据技术体系。强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及HadoopSpark大数据项目全过程沙盘模拟实战。

通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖HadoopSpark生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解HadoopSpark大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本思维素养。

本课程的授课师资都是有着多年在一线从事HadoopSpark大数据项目的资深讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的技术讨论与咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识,具备实际项目动手开发实践与部署运维能力。授课过程中学员可将具体工作中遇到的实际问题拿出来,讲师会根据学员的实际情况微调授课内容,并给出一定的时间让学员上台发言,由讲师带着全部学员积极讨论,现场剖析问题的症结,规划出可行的解决方案。

 

 

二、     培训目标

1.    深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势,洞察大数据的潜在价值,结合业界市场需求和国内外最新的大数据技术潮流,掌握大数据项目解决方案以及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考,帮助学员为企业在利用大数据方面体现出自身价值。

2.    全面掌握业界最流行的HadoopSpark大数据技术体系,掌握包括大数据采集技术、大数据分布式存储技术、NoSQLNewSQL分布式数据库技术、大数据仓库与统计机器学习技术、大数据分析挖掘与商业智能(BI)技术、大数据离线处理技术、Storm流式大数据处理技术、基于内存计算的大数据实时处理技术,以及大数据管理技术的原理知识和应用实战。

3.    深入理解大数据平台技术架构和使用场景,能娴熟地运用HadoopSpark大数据技术体系规划解决方案满足实际项目需求,部署符合生产环境要求的Hadoop大数据集群,熟练地掌握基于HadoopSpark大数据平台进行应用程序开发、集群运维管理和性能调优技巧,并通过具体的实训项目贯穿整个课程进行实战锻炼。

 

三、     培训师资

中培教育大数据技术系列培训讲师团:

钟老师 现任职于中科院某研究所,高级工程师,副高职称,项目组负责人,博士毕业于中国科学院计算技术研究所,获工学博士学位(计算机系统结构方向)。中培教育的大数据、云计算、移动互联网系列课程建设与教学专家。近六年来带领团队主要从事大数据与云计算技术项目的研发与IT项目管理工作,主要精通Hadoop平台技术,基于内存计算的实时处理技术(Spark),分布式文件系统技术,MapReduceYarn分布式并行计算技术,大数据分布式采集技术(Flume-NG),大数据分布式消息系统技术(Kafka),KVS键值存储系统技术,大数据管理与分析处理技术,NoSQLNewSQL分布式数据库(HBaseCassandraMongoDB),内存数据库技术(RedisMembase/Memcached),大数据挖掘与机器学习技术(Mahout),大数据仓库技术(HIVE),实时数据仓库技术(Shark),大数据中心集群监控与运维(HUE)技术的实现细节。钟老师有着多年的企业内训和公开课培训讲师经历,主要讲授大数据平台技术、云计算、移动互联网、电子商务、IT信息软件项目管理、企业信息化规划与管理、IT战略规划与企业架构、数据中心主机规划与IDC系统运营等企业实战类培训课程。钟老师将原理技术剖析和应用实战相结合的授课风格受到广大公开课学员和企业内训学员的欢迎,钟老师已授课的企业内训客户包括:中国人寿总部、中海油信息中心、中国移动总部和若干个省级分公司、国家电网总部以及若干下属企业、中石化信息中心、中国联通、中国邮政、徽商银行、江苏南瑞集团、北京银行、燕山石化总部信息部、航天科技某院所、航天科工某院所、中石油总部信息部与若干直属企业信息部、中电集团某所、瑞中科技等五十余家国内大型国有企事业单位和民营上市公司。钟老师还讲授过百余场云计算、大数据与移动互联网公开课培训课程。

蒋德钧  清华大学博士,云计算专家 熟悉主流的云计算平台,并有商业与开源云计算平台的实践经验,对云计算关键技术有深刻了解和实践经验,如分布式系统、虚拟化、分布式文件系统、云存储等,参与并领导多个大型云计算项目。对大数据关键技术有深刻了解和实践经验,如NoSQL数据库、大数据处理、HadoopHiveHBaseSpark等。

钱兴会   大数据专家。在电信、电力、金融行业从事Java开发和架构设计的工作;资深云计算研发工程师。作为项目的主要成员和负责人参与并领导完成了多个大型复杂项目,并成功应用于行业解决方案,如海量数据匹配系统、电力行业实时数据采集分析系统等。设计并实现了实时索引系统-云搜,成功应用与某国企知识库系统。并可应用与互联网行业的搜索等应用。完成多个云计算解决方案的架构,涉及到金融行业海量数据分析与数据处理系统、海量日志分析系统、电力用电信息统计系统等,获得业界认可。

四、     培训对象

1.  大数据HadoopSpark技术的应用开发工程师

2.  大数据分析与挖掘工程师

3.  大数据集群运维工程师

4.  大数据项目的IT管理人员

5.  大数据项目规划的咨询人员

6.  HadoopSpark大数据技术感兴趣的爱好者

7.  打算上线大数据项目及具有大数据应用需求的各行业的企业信息化技术与管理人员

8.  具备一定的JavaLinux基础的尤佳。

五、     培训证书 

本课程颁发证书,证书查询: www.zpedu.org (中国信息化培训中心)

中国信息化培训中心颁发的《大数据Hadoop开发高级架构师》证书。

证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。

六、培训费用

5800 /人(含培训费、考试费、证书费、资料费、午餐) 食宿统一安排,费用自理。(请学员带一寸彩照2张—背面注明姓名,身份证复印件一张)。

七、培训内容

日程

培训模块

培训要点

第一天

上午

一、            大数据技术基础入门

1.      大数据的产生背景、发展历程

2.      大数据和云计算的关系

3.      大数据应用需求以及潜在价值分析

4.      业界最新的大数据技术发展态势与应用趋势

5.      大数据项目的技术选型与架构设计

6.      “互联网+”时代下的电子商务、制造业、零售批发业、电信运营商、互联网金融业、网上银行、电子政务、移动互联网、教育信息化等行业应用实践与应用案例剖析

二、            业界主流的大数据技术产品与项目解决方案

7.      国内外主流的大数据解决方案介绍

8.      当前大数据解决方案与传统数据库方案的剖析比较

9.      Apache大数据平台方案剖析

10.  CDH大数据平台方案剖析

11.  HDP大数据平台方案剖析

12.  开源的大数据生态系统平台剖析

三、            HadoopSpark大数据处理平台

13.  Hadoop的发展历程以及产业界的实际应用介绍

14.  Hadoop大数据平台架构,以及PB级大数据处理工作原理与机制

15.  Hadoop的核心组件剖析

16.  Spark的发展历程以及业界的实际应用介绍

17.  Spark实时大数据处理平台架构,以及内存大数据处理工作原理与机制

18.  Spark的核心组件剖析

第一天

下午

四、            大数据采集与分布式消息订阅系统

19.  Flume-NG数据采集系统的数据流模型、平台架构、集群部署与配置应用实战

20.  Kafka分布式消息订阅系统的应用介绍、平台架构、集群部署与配置应用实战

21.  Scribe分布式日志收集系统的简介、工作原理、平台架构、集群部署与配置应用实战

22.  ZooKeeper分布式协调服务系统的工作原理、平台架构、集群部署与配置应用实战

五、            大数据分布式存储系统

23.  分布式文件系统HDFS的简介

24.  HDFS系统的主从式平台架构和工作原理

25.  HDFS核心技术讲解

26.  HDFS应用开发实战

27.  HDFS集群的安装、部署、配置与性能优化技巧

28.  分布式键值存储系统介绍、平台架构、核心技术以及应用开发

29.  PB及大数据存储系统的项目案例分析

六、            大数据MapReduceYarn并行处理平台

30.  MapReduce并行计算模型

31.  MapReduce作业执行与调度技术

32.  第二代大数据计算框架Yarn的工作原理以及DAG并行执行机制

33.  MapReduce应用开发环境的部署,以及大数据并行处理应用程序开发

34.  MapReduce高级编程技巧与性能优化实践

35.  MapReduceYarn项目案例实践

第二天

上午

七、            大数据Spark实时处理平台

36.  内存计算模型和实时处理技术介绍

37.  Spark分布式实时处理框架及工作原理

38.  Spark集群的平台架构及其生态系统组件剖析

39.  Spark SQL应用实践

40.  Spark Streaming应用实践

41.  MLib/MLBase实时机器学习应用实践

42.  GraphX实时图数据处理应用实践

43.  Spark实时处理集群的安装部署与配置优化

44.  Spark的编程开发应用实战

45.  SparkHadoop的对接集成解决方案实践

八、            Storm流式数据处理平台

46.  Storm流式处理系统介绍、平台架构以及工作原理

47.  Storm集群安装部署与配置优化

48.  Storm日志分析项目应用实战

第二天

下午

九、            HBase分布式数据库管理系统

49.  NoSQL数据库与NewSQL数据库技术介绍,及其在半结构化和非结构化大数据方面的应用实践

50.  HBase分布式数据库简介、数据模型以及工作原理

51.  HBase分布式数据库集群的平台架构和关键技术剖析

52.  HBase应用项目开发技巧,以及客户端开发实战

53.  HBase表设计与数据操作以及数据库管理API调用

54.  HBase集群的安装部署与配置优化

55.  HBase集群的运维与监控管理

十、            Cassandra数据管理系统

56.  Cassandra数据存储管理系统的应用介绍

57.  Cassandra集群的平台架构以及核心关键技术

58.  Cassandra一致性哈希算法与数据对象分布策略

59.  Cassandra集群的安装部署与配置优化

60.  Cassandra应用开发实战

第三天

上午

十一、    内存数据库管理系统集群

61.  Impala实时查询系统的应用介绍

62.  Impala实时查询系统平台架构、核心关键技术剖析

63.  Impala实时查询系统的部署与应用开发实践

64.  Redis内存数据库介绍,以及业界应用案例

65.  Redis内存数据库集群架构以及核心技术剖析

66.  Redis集群的安装部署与应用开发实战

十二、    大型数据仓库Hive集群平台

67.  基于Hadoop的大型分布式数据仓库基础知识,以及在行业中的应用实践案例

68.  基于Spark的实时数据仓库集群基础知识,以及在行业中的应用实践案例

69.  Hive大数据仓库简介以及应用介绍

70.  Hive数据仓库集群的平台体系结构、核心技术剖析

71.  Hive Server工作原理与应用技巧

72.  Hive数据仓库集群的安装部署与配置优化

73.  Hive应用开发技巧

74.  Hive QL定义以及应用

75.  Hive数据仓库表与表分区、表操作、数据导入导出、客户端操作技巧

76.  Hive数据仓库报表设计、HWICLI客户端演示以及用户自定义函数(UDF)的开发实践

第三天

下午

十三、    Mahout大数据分析挖掘平台

77.  大数据分析挖掘技术介绍,以及行业大数据挖掘应用案例

78.  Mahout大数据挖掘平台的体系架构、核心算法与关键技术运用

79.  基于Mahout的数据挖掘应用程序开发实战

80.  Mahout集群的安装部署与配置优化

81.  集成MahoutHadoop集成大数据挖掘平台应用实战

十四、    大数据智能化ETL操作以及Hadoop集群运维监控工具平台应用

82.  HadoopDBMS之间进行数据转换的框架

83.  Sqoop导入导出数据的工作原理,以及Sqoop集群安装部署与配置

84.  Kettle集群的平台架构、核心技术工作原理以及应用案例

85.  Kettle集群安装部署与配置,以及应用开发实战

86.  利用Sqoop实现MySQLHadoop集群之间的数据导入导出交互程序

87.  Hadoop大数据运维监控系统HUE平台的安装部署与配置优化

十五、    大数据项目应用实战

88.  根据布置的实际应用案例,开展大数据完整项目部署设计和应用开发实践

八、报名回执

单位名称(开发票名称)

通讯地址

邮 编

联 系 人

电 话

传 真

学员姓名

职务

性别

   

联系电话及手机

培训地点

 

 

  名:北京中培伟业管理咨询有限公司

开户行:北京农村商业银行卢沟桥支行营业部

  号:0203010103000033172

  名:中培创成(北京)科技有限公司

开户行:建设银行北京生命园支行

  号:11001048600052506592

    名:北京高培伟业管理咨询有限公司

行:中国工商银行股份有限公司北京菜市口支行

    号:0200001809200152881

学员签字或盖章

九、联系方式

联系人:倪闯  18701378400        电 话:010-81363590

  真:010-81363590     Email1658122838@qq.com     

  址:www.zpedu.org    QQ1658122838           

                                       二○一四年十一月二十六

 

 

[1]

 
网络安全热度最高的6本证书...
系统分析师VS系统架构设计...
项目经理考NPDP还是软考高...
盘点五个IT领域下证快的证...
CBA与TOGAF:探寻企业架构...
【收藏】软考电子证书下载...
项目经理任选两本证书,年...
DAMA中国推出“一考两证”...
数据分析具体指的是什么,...
数据分析师需要具备什么数...
CDA认证带你了解数据分析的...
敏捷与DevOps协同工作的注...
DevOps自动化测试的注意事...
DevOps五个好用的工具列表...
IT项目管理实现落地有哪些...
IT项目需求分析重点是建立...


中培IT学院 Copyright@2006-2024  北京中培伟业管理咨询有限公司.ALL Rights Reseved 备案号:京ICP备13024721号-2