大数据Spark SQL慕课网日志分析 资源介绍
本课程以“慕课网日志分析”这一大数据应用案例为主线,使用慕课网真实日志,以目前主流的、最新的Spark稳定版2.1.x为基础,依次介绍相关的大数据技术:Hadoop、Hive、Spark SQL,涉及数据清洗、统计存储、处理入库以及数据可视化(Echarts、Zeppelin),最终会形成一个完整的大数据项目。
快速“变身”大数据攻城狮, 你的不二之选!一个有野心的攻城狮,只要你熟悉Linux、SQL和一门编程语言就可以轻松华丽转型大数据攻城狮,“钱”途无限!
以真实的“慕课网日志”这一应用案例为主线进行分析采用最新的Spark稳定版2.1.x 为基础,依次介绍大数据热门技术:Hadoop、Hive、Sprak SQL,涉及数据清洗,统计存储,处理入库以及数据可视化(ECharts、Zeppelin),最终形成一个完整的大数据项目。
资源目录:
第1章 初探大数据 第2章 Spark及其生态圈概述 第3章 实战环境搭建 第4章 Spark SQL概述 第5章 从Hive平滑过渡到Spark SQL 第6章 DateFrame&Dataset 第7章 External Data Source 第8章 SparkSQL愿景 第9章 慕课网日志实战 第10章 Spark SQL扩展和总结