2021贺岁大数据入门spark3.0入门到精通
课程下载
本课程供VIP会员免费学习。
下载途径:共5.57GB,网盘转存下载。
课程介绍
本课程中使用官方在2020年9月8日发布的Spark3.0系列最新稳定版:Spark3.0.1。共课程包含9个章节:Spark环境搭建,SparkCore,SparkStreaming,SparkSQL,StructuredStreaming,Spark综合案例,Spark多语言开发,Spark3.0新特性,Spark性能调优 。
课程目录
Spark-day01
00-[了解]-课程内容介绍.mp4
01-[了解]-Spark发展历史和特点介绍.mp4
02-[掌握]-Spark环境搭建-local本地模式.mp4
03-[掌握]-Spark环境搭建-Standalone集群模式.mp4
04-[掌握]-Spark环境搭建-Standalone-HA集群模式.mp4
05-[细心]-Spark环境搭建-On-Yarn-原理和准备工作.mp4
06-[理解]-Spark环境搭建-On-Yarn-两种模式.mp4
07-[掌握]-Spark环境搭建-On-Yarn-两种模式演示.mp4
08-[补充]-Spark环境搭建-spark-shell和spark-submit.mp4
09-[掌握]-Spark代码开发-准备工作.mp4
10-[重点]-Spark代码开发-入门案例.mp4
11-[重点]-Spark代码开发-OnYarn.mp4
12-[理解]-Spark代码开发-WordCount图解.mp4
13-[总结]-总结和作业.mp4
Spark-day02
01-[理解]-RDD理论详解.mp4
02-[掌握]-RDD的创建.mp4
03-[掌握]-RDD的操作分类和基本操作演示.mp4
04-[掌握]-RDD的分区操作.mp4
05-[掌握]-RDD的重分区操作.mp4
06-[掌握]-RDD的聚合操作.mp4
07-[面试题]-RDD的聚合reduceByKey和groupByKey.mp4
08-[掌握]-RDD的关联.mp4
09-[掌握]-RDD的排序.mp4
10-[掌握]-RDD的缓存-持久化.mp4
11-[掌握]-RDD的Checkpoint.mp4
12-[掌握]-共享变量-广播变量和累加器.mp4
13-[掌握]-外部数据源-多种数据格式.mp4
14-[了解]-外部数据源-操作JDBC-写.mp4
15-[了解]-外部数据源-操作JDBC-读.mp4
Spark-day03
01-[理解]-spark内核原理-依赖关系.mp4
02-[理解]-spark内核原理-DAG和Stage.mp4
03-[理解]-spark内核原理-名词解释.mp4
04-[理解]-spark内核原理-job提交流程.mp4
05-[理解]-spark内核原理-web-UI查看.mp4
06-[了解]-搜狗搜索日志分析-需求和分词测试.mp4
07-[了解]-搜狗搜索日志分析-代码实现.mp4
08-[了解]-流式计算应用场景.mp4
09-[了解]-流式计算实现模式.mp4
10-[了解]-SparkStreaming介绍-特点-流程-原理.mp4
11-[理解]-SparkStreaming数据抽象-DStream.mp4
12-[掌握]-SparkStreaming案例1-WordCount.mp4
13-[掌握]-SparkStreaming案例2-状态管理.mp4
14-[扩展]-SparkStreaming案例3-状态恢复.mp4
15-[重难点]-SparkStreaming案例4-窗口计算.mp4
Spark-day04
01-[掌握]-SparkStreaming案例5-topN.mp4
02-[掌握]-SparkStreaming案例6-自定义输出.mp4
03-[了解]-SparkStreaming整合Kafka前置说明-连接方式和API版本.mp4
04-[重点]-SparkStreaming整合Kafka-代码实现-1-自动提交偏移量.mp4
05-[掌握]-SparkStreaming整合Kafka-代码实现-2-手动提交偏移量.mp4
06-[扩展]-SparkStreaming整合Kafka-代码实现-3-手动提交偏移量到MySQL.mp4
07-[了解]-SparkSQL概述-数据分析方式.mp4
08-[了解]-SparkSQL概述-官方介绍-数据格式.mp4
09-[理解]-SparkSQL数据抽象.mp4
10-[掌握]-SparkSQL实战-1-加载数据成为分布式表.mp4
11-[掌握]-SparkSQL实战-2-RDD转DF-1-使用样例类.mp4
12-[掌握]-SparkSQL实战-2-RDD转DF-2-指定类型+列名.mp4
13-[掌握]-SparkSQL实战-2-RDD转DF-3-自定义Schema.mp4
14-[掌握]-SparkSQL实战-3-RDD-DF-DS-相互转换.mp4
15-[掌握]-SparkSQL实战-4-花式查询.mp4
16-[掌握]-SparkSQL实战-5-WordCount.mp4
Spark-day05
01-[掌握]-SparkSQL案例-6-多数据源支持.mp4
02-[掌握]-SparkSQL案例-7-电影数据分析.mp4
03-[掌握]-SparkSQL案例-8-SparkSQL-UDF.mp4
04-[掌握]-SparkSQL整合Hive-1-SparkSQL命令行.mp4
05-[掌握]-SparkSQL整合Hive-2-SparkSQL代码中操作Hive.mp4
06-[掌握]-SparkSQL分布式SQL引擎.mp4
07-[了解]-StructuredStreaming引入.mp4
08-[了解]-StructuredStreaming介绍.mp4
09-[理解]-StructuredStreaming编程模型和数据抽象.mp4
10-[掌握]-StructuredStreaming-Source-Socket.mp4
11-[了解]-StructuredStreaming-Source-Rate.mp4
12-[了解]-StructuredStreaming-Source-File.mp4
13-[掌握]-StructuredStreaming-Operation.mp4
14-[掌握]-StructuredStreaming-输出模式.mp4
15-[掌握]-StructuredStreaming-输出位置.mp4
16-[掌握]-StructuredStreaming-ForeachBatch.mp4
17-[掌握]-StructuredStreaming-连续处理和Checkpoint.mp4
Spark-day06
01-[了解]-StructuredStreaming整合Kafka官方说明.mp4
02-[掌握]-StructuredStreaming整合Kafka-案例1-实时ETL.mp4
03-[掌握]-StructuredStreaming整合Kafka-案例2-物联网设备实时分析.mp4
04-[掌握]-StructuredStreaming-基于事件时间的窗口计算-水位线解决数据延迟到达问题.mp4
05-[掌握]-StructuredStreaming-流去重.mp4
06-[了解]-Spark综合案例-流程分析和业务模块划分.mp4
07-[了解]-Spark综合案例-环境搭建和数据发送.mp4
08-[掌握]-Spark综合案例-实时数据分析-代码实现-1-数据加载和转换.mp4
09-[掌握]-Spark综合案例-实时数据分析-代码实现-2-业务需求代码实现.mp4
10-[理解]-Spark综合案例-实时推荐易错题-需求分析和模型准备.mp4
11-[掌握]-Spark综合案例-实时推荐易错题-代码实现-1-加载数据和模型.mp4
12-[掌握]-Spark综合案例-实时推荐易错题-代码实现-2-给用户推荐并存储推荐结果.mp4
Spark-day07
01-[理解]-Spark综合案例-学生答题情况离线分析-需求分析.mp4
02-[理解]-Spark综合案例-学生答题情况离线分析-代码实现-1.mp4
03-[理解]-Spark综合案例-学生答题情况离线分析-代码实现-2.mp4
04-[补充]-推荐系统概述.mp4
05-[补充]-推荐算法分类.mp4
06-[补充]-推荐算法-ALS-数学基础补充.mp4
07-[补充]-推荐算法-ALS-案例需求和算法思想.mp4
08-[补充]-推荐算法-ALS-电影推荐案例-代码实现.mp4
09-[补充]-推荐算法-ALS-在易错题推荐案例中的模型实现.mp4
10-[了解]-Spark3.0诞生背景.mp4
11-[了解]-Spark3.0新特性-动态分区裁剪.mp4
12-[了解]-Spark3.0初体验-代码演示.mp4
12-[了解]-Spark3.0新特性-自适应查询执行优化.mp4
13-[了解]-Spark3.0新特性-加速器感知调度.mp4
14-[了解]-Spark3.0新特性-更好的API扩展.mp4
15-[了解]-Spark3.0新特性-更好的SQL支持和SparkR的向量化读写.mp4
16-[理解]-Spark3.0初体验-静态分区裁剪.mp4
17-[理解]-Spark3.0初体验-动态分区裁剪.mp4
18-[注意]-Spark3.0初体验-参数设置和注意事项.mp4
19-[理解]-Spark3.0初体验-结果对比.mp4
20-[了解]-Spark生态与未来.mp4
Spark-day08
01-[了解]-Spark多语言开发-说明.mp4
02-[掌握]-Spark多语言开发-JavaSpark-SparkCore.mp4
03-[掌握]-Spark多语言开发-JavaSpark-SparkStreaming.mp4
04-[掌握]-Spark多语言开发-JavaSpark-SparkSQL.mp4
05-[掌握]-Spark多语言开发-JavaSpark-StructuredStreaming.mp4
06-[了解]-Spark多语言开发-JavaSpark-线性回归算法-房价预测案例.mp4
07-[了解]-Spark多语言开发-JavaSpark-线性回归算法-房价预测案例-代码实现.mp4
08-[了解]-Spark多语言开发-PySpark-SparkCore.mp4
09-[了解]-Spark多语言开发-PySpark-SparkStreaming.mp4
10-[了解]-Spark多语言开发-PySpark-SparkSQL.mp4
11-[了解]-Spark多语言开发-PySpark-StructuredStreaming.mp4
12-[了解]-Spark多语言开发-PySpark-决策树算法-相亲决策案例-需求-原理.mp4
13-[了解]-Spark多语言开发-PySpark-决策树算法-相亲决策案例-代码实现.mp4
14-[了解]-Spark性能优化-9项基本原则.mp4
15-[了解]-Spark性能优化-N多配置参数.mp4
16-[了解]-Spark性能优化-数据倾斜.mp4
17-[了解]-Spark性能优化-shuffle优化.mp4
18-[了解]-Spark性能优化-内存管理.mp4
资料