资源介绍
优效学院出品的大数据精英培训课程,价值6000+.通过真实企业项目,JAVA高并发、Hadoop、Hive、Scala、Spark、Python、机器学习等大数据技能,实现年薪翻番。4大核心项目让你快速掌握架构体系以及处理架构方案。
课程大纲:
- 01.开班典礼
- 02.hadoop-hdfs 存储、架构模型、角色、持久化
- 03.hadoop-hdfs 读写流程、配置、完全分布式&CLI命令
- 04.hadoop-hdfs api开发 HA集群搭建
- 05.hadoop-MR YARN架构理论与集群搭建、WordCount
- 06.hadoop-MR 开发&源码分析
- 07.hadoop-MR MapTask、MapTask、ReduceTask源码分析
- 08.MR源码分析:Mapask输出分析、Reduceask输入分析
- 09.MR源码分析Reduceask输出分析及MR天气案例
- 10.hadoop-MR开发案例:好友推荐案例及pagerank案例
- 11.hadoop-MR开发案例:tfidf案例及itemcf案例
- 12.Hive介绍以及安装
- 13.Hive实战
- 14.HBase介绍以及安装
- 15.HBase调优
- 16.Hadoop项目需求分析
- 17.Hadoop项目准备
- 18.Hadoop项目数据采集以及清洗
- 19.Hadoop项目代码实现以及优化
- 20.Hadoop项目架构扩展以及组件整合
- 21.storm理论-Storm介绍以及代码实战
- 22.storm理论-Storm伪分布式搭建以及任务部署
- 23.storm理论-Storm架构详解以及DRCP原理
- 24.redis理论-redis类型
- 25.redis理论-redis高级
- 26.Scala语法—Scala语法介绍
- 27.Scala语法—scala语法实战
- 28.Spark理论—介绍
- 29.Spark介绍、RDD的五大特性
- 30.RDD算子的讲解
- 31.RDD控制类算子以及集群搭建
- 32.SparkPi 计算圆周率的原理高可用集群的搭建
- 33.任务调度流程01
- 34.任务调度流程02
- 35.任务调度流程03
- 36.资源调度流程
- 37.多种提交Application的方式以及 SparkShuffle
- 38.SparkShuffle
- 39.案例
- 40.广播变量、累加器
- 41.重分区算子
- 42.SparkSQL介绍
- 43.SparkSQL处理parquet json数据
- 44.SparkSQL自定义函数 Spark on hive整合步骤
- 45.配置thrift server 安全机制 以及小区掉话率的统计案例
- 46.Spark调优(资源,并行度)
- 47.Spark调优(数据本地化调优)
- 48.Spark解决数据倾斜的方案、SparkStreaming介绍
- 49.SparkStreaming案例
- 50.SparkStreaming on kafka
- 51.机器学习项目-推荐系统介绍以及架构分析
- 52.机器学习项目-推荐系统的特征工程
- 53.机器学习项目-推荐系统代码实现以及部署
- 54.Elasticsearch理论-Elasticsearch搜索原理
- 55.Elasticsearch理论-Elasticsearch实战
- 56.大数据面试培训(一)
- 57.大数据面试培训(二)
- 58.机器学习
- 59.ElasticSearch
- 60.机器学习