马士兵-Python大数据全栈工程
课程下载
本课程供VIP会员免费学习。
下载途径:共237.8GB,网盘转存下载。
课程介绍
课程目录
001.hadoop-大数据启蒙-初识HDFS.mp4
002.hadoop-HDFS理论基础读写流程.mp4
003.hadoop-HDFS集群搭建-伪分布式模式 1.mp4
003.hadoop-HDFS集群搭建-伪分布式模式 2.mp4
004.hadoop-HDFS集群搭建-HA模式概念 1.mp4
004.hadoop-HDFS集群搭建-HA模式概念 2.mp4
005.hadoop-HDFS集群搭建-HA模式验证.mp4
006.hadoop-HDFS权限、企业级搭建、idea+maven开发HDFS 1.mp4
006.hadoop-HDFS权限、企业级搭建、idea+maven开发HDFS 2.mp4
007.hadoop-MapReduce原理精讲、轻松入门.mp4
008.hadoop-Mapkeducen度原理,Varn原埋 1.mp4
008.hadoop-Mapkeducen度原理,Varn原埋 2.mp4
009.hadoop-MapReduce-Yar集群搭建、idea开发MR的wC程序 1.mp4
009.hadoop-MapReduce-Yar集群搭建、idea开发MR的wC程序 2.mp4
010.hadoop-MapReduce作业提交方式、源码-客户端提交源码 1.mp4
010.hadoop-MapReduce作业提交方式、源码-客户端提交源码 2.mp4
011.hadoop-MapReduce源码-MapTask-input源码精讲.mp4
012.adoop-MapReduce源码-MapTask-output和ReduceTask精讲 1.mp4
012.adoop-MapReduce源码-MapTask-output和ReduceTask精讲 2.mp4
013.hadoop-MapReduce开发-分组取TopN-AP精炼 1.mp4
013.hadoop-MapReduce开发-分组取TopN-AP精炼 2.mp4
014.hadoop-MapReduce开发推荐系统大数据思维模式.mp4
015 Hive的架构介绍及远程数据库模式安装 1.mp4
015 Hive的架构介绍及远程数据库模式安装 2.mp4
016 Hive的远程元数据服务模式安装及Hive SOL 1.mp4
016 Hive的远程元数据服务模式安装及Hive SOL 2.mp4
017.Hive erde,HiveServer2,Hive函数 1.mp4
017.Hive erde,HiveServer2,Hive函数 2.mp4
018.Hive参数设置、运行方式、动态分区、分桶 1.mp4
018.Hive参数设置、运行方式、动态分区、分桶 2.mp4
019.Hive视图、索引、权限管理 1.mp4
019.Hive视图、索引、权限管理 2.mp4
020.Hivet化、文件类型、HiveServer2高可用 1.mp4
020.Hivet化、文件类型、HiveServer2高可用 2.mp4
021.HBase架构介绍、数据模型 1.mp4
021.HBase架构介绍、数据模型 2.mp4
022.HBase伪分布式及完全分布式安装、HBase基本命令 1.mp4
022.HBase伪分布式及完全分布式安装、HBase基本命令 2.mp4
023.HBase Java API、Protocol Buffer简单介绍 1.mp4
023.HBase Java API、Protocol Buffer简单介绍 2.mp4
024.HBase与MapReduce整合、Hbase表设计 1.mp4
024.HBase与MapReduce整合、Hbase表设计 2.mp4
025.Hbase优化及LSM树 1.mp4
025.Hbase优化及LSM树 2.mp4
026.Hadoop项目-需求介绍及数据源产生流程需求介绍及数据流图 1.mp4
026.Hadoop项目-需求介绍及数据源产生流程需求介绍及数据流图 2.mp4
027.Hadoop项目-java端和js端数据产生代码讲解及flume简单介绍 1.mp4
027.Hadoop项目-java端和js端数据产生代码讲解及flume简单介绍 2.mp4
028.Hadoop项目-Flume讲解及数据清洗模块准备工作 1.mp4
028.Hadoop项目-Flume讲解及数据清洗模块准备工作 2.mp4
029.Hadoop项目-数据清洗代码分析、hive与hbase整合、指标分析思路 1.mp4
029.Hadoop项目-数据清洗代码分析、hive与hbase整合、指标分析思路 2.mp4
030.Hadoop项目-手敲用户新增指标模块代码 1.mp4
030.Hadoop项目-手敲用户新增指标模块代码 2.mp4
031.Hadoop项目-MR输出数据到mysql的输出格式化类、sqo0p的简单介绍 1.mp4
031.Hadoop项目-MR输出数据到mysql的输出格式化类、sqo0p的简单介绍 2.mp4
032.Hadoop项目-Hive SQL分析用户浏览深度代码讲解及脚本编写 1.mp4
032.Hadoop项目-Hive SQL分析用户浏览深度代码讲解及脚本编写 2.mp4
033.redis介绍及NIO原理介绍 1.mp4
033.redis介绍及NIO原理介绍 2.mp4
034.redis的string类型&;bitmap 1.mp4
034.redis的string类型&;bitmap 2.mp4
035.redis的list,set,hash,sorted set、skiplist 2.mp4
035.redis的list,set,hash,sorted set、skiplist 1.mp4
036.redis消息订阅、pipeline、事务、modules、布隆过滤器、缓存LRU 1.mp4
036.redis消息订阅、pipeline、事务、modules、布隆过滤器、缓存LRU 2.mp4
037.redis的持久化RDB、fork、copyonwrite、AOF、RDB&;AOF混合使用 1.mp4
037.redis的持久化RDB、fork、copyonwrite、AOF、RDB&;AOF混合使用 2.mp4
038.redis的集群:主从复制、CAP、PAXOS、cluster分片集群01.mp4
039.redis的集群:主从复制、CAP、PAXOS、cluster分片集群02.mp4
040.redis开发:spring.data.redis、连接、序列化、high-low api.mp4
041.zookeeper介绍、安装、shellcli使用,基本概念验证.mp4
042.zookeeper原理知识,paxos、zab、角色功能、API开发基础.mp4
043.zookeeper案例:分布式配置注册发现、分布式锁、ractive模式编程.mp4
044.scala语言、函数式编程、数据集处理、iterator设计模式实现.mp4
045.scala语言、流程控制、高级函数.mp4
046.scala语言、集合容器、iterator设计模式源码分析.mp4
047.scala语言、match,case class、implicitt、spark wordcount.mp4
048.spark-core、复习hadoop生态、梳理术语、hadoopRDD源码分析.mp4
049.spark-core、wordcount案例源码分析、图解.mp4
050.spark-core、集合操作API、pvuv分析、RDD源码分析.mp4
051.spark-core、聚合计算API、combineByKey、分区调优.mp4
052.spark-core、二次排序、分组取TOpN、算子综合应用.mp4
053.spark-core、集群框架图解、角色功能介绍、官网学习、搭建.mp4
054.spark-core、history服务、standaloneHA、资源调度参数.mp4
055.spark-core、基于yarn的集群搭建、配置、资源调度参数、优化jars.mp4
056.spark-core-源码、RpcEnv、standaloneMaster启动分析.mp4
057.spark-core-源码、Worker启动、sparksubmit提交、Driver启动.mp4
058.spark-core-源码、Application注册、Executor资源申请.mp4
059.spark-core-源码、sparkContext、DAGScheduler、stage划分.mp4
060.spark-core-源码、Taskscheduler、Executor运行Task、SparkEnv.mp4
061.spark-core-源码、MemoryManager、BlockManager.mp4
062.spark-core-源码、Dependency、SortShuffleManager.mp4
063.spark-core-源码、SortShuffleWriter、内存缓冲区buffer.mp4
064.spark-core-源码、SortShuffleWriter、内存缓冲区buffer.mp4
065.spark-core-源码、UnsafeShufleWriter、Tungsten、Unsafe、堆外.mp4
066.spark-core-源码、ShuffleReader、Tracker、Scheduler完整调度.mp4
067.spark-core-源码、RDD持久化、检查点、广播变量、累加器.mp4
068.spark-core-源码、RDD持久化、检查点、广播变量、累加器.mp4
069.spark-sql、大数据中的SQL组成原理.mp4
070.spark-sql、datafram到dataset开发.mp4
071.spark-sql、整合hive的metastore搭建企业级数合1.mp4
072.spark-sql、整合hive的metastore搭建企业级数仓2.mp4
073.spark-sql、复杂sql、函数、自定义函数、开窗over函数、OLAP.mp4
074.spark-sql-源码、sql解析、dataset到rdd的执行计划.mp4
075.spark-sql-源码、antlr4的sql解析、AST语法树的逻辑到物理转换.mp4
076.spark-sql-源码、逻辑计划、优化器、物理计划、转换RDD.mp4
077.spark-streaming、流式计算之微批计算原理及standalone.mp4
078.spark-streaming、api、ha、检查点、窗口等机制.mp4
079.spark-streaming、整合MQ-kafka开发.mp4
080.spark-streaming、源码分析、流式微批任务的调度原理.mp4
081.spark-streaming.mp4
082.机器学习介绍、原理及应用场景.mp4
083.线性回归算法的原理及参数优化方案.mp4
084.基于Spark MLlib训练回归算法模型.mp4
085.逻辑回归算法的原理及算法公式推导.mp4
086.KNN识别手写数字与KMeans聚类算法原理.mp4
087.KNN手写数字识别及KMeans算法原理.mp4
088.手写KMeans聚类算法及实现精准微博营销案例.mp4
089.分析KMeans精准营销案例代码及KMeans在推荐系统的应用.mp4
090.逻辑回归算法原理及公式推导.mp4
091.逻辑回归算法原理及公式推导.mp4
092.逻辑回归算法及实现百度路况预测功能.mp4
093.百度地图实时路况及路况预测.mp4
094.决策树算法的原理.mp4
095.随机森林算法与算法总结.mp4
096.推荐系统的来龙去脉与推荐架构.mp4
097.推荐系统架构设计及构建推荐系统训练集.mp4
098.推荐系统代码实现及测试.mp4
099.实现推荐系统在线推荐微服务.mp4
100.基于节目的推荐系统,架构剖析,数据迁移.mp4
101.提取节目的关键词,构建节目画像.mp4
102.基于TextRank算法+TF-IDF算法提取关键词.mp4
103.构建节目画像与用户画像.mp4
104.构建用户画像及性能调优.mp4
105.基于节目画像计算节目的相似度.mp4
106.Spark调优总结及word2vec算法原理.mp4
107.基于物品画像计算相似度.mp4
108.实现基于模型的召回策略.mp4
109.构建特征中心及模型召回实现.mp4
111.训练排序模型及搭建推荐系统微服务.mp4
112.推荐系统项目一大总结.mp4
113.Flink初始及搭建集群环境.mp4
114.Flink基于Yarn多种启动方式.mp4
115.Flink运行架构及并行度设置.mp4
116.Flink各种算子精讲1.mp4
117.Flink各种算子精讲2.mp4
118.Flink各种算子精讲3 1.mp4
118.Flink各种算子精讲3 2.mp4
119.基本函数类及富函数的使用.mp4
120.Elasticsearch核心概念.mp4
121.ES环境安装、健康值检查以及CRUD.mp4
122.ES环境安装、健康值检查以及CRUD.mp4
123.Flink Checkpoint及SavePoint精讲.mp4
124.Flink Window窗口剖析1.mp4
125.上机实战演练:ES查询语法.mp4
126.Flink Window剖析2.mp4
127.Mapping和聚合查询.mp4
128.Flink时间语义+Watermark.mp4
129.Flink Window剖析3.mp4
130.ES查询之底层原理揭秘.mp4
大数据一课课件.zip
第131节 ES查询之Scripting查询.mp4
第132节 Flink Table API 编程.mp4
第133节 ES查询之分词器详解.mp4
第134节 Flink SQL编程.mp4
第135节 Flink 复杂事件处理CEP.mp4
第136节 ES查询之前缀搜索、通配符搜索、正则搜索、模糊查询串讲.mp4
第137节 CEP编程和Flink优化.mp4
第138节 交通实时监控项目1.mp4
第139节 ES Java API.mp4
第140节 交通实时监控项目2.mp4
第141节 ES.mp4
第143节 交通实时监控项目3.mp4
第144节 交通实时监控项目4.mp4
第145节 ELK Stack-ES集群.mp4
第146节 ELK Stack-ES集群.mp4
第147节 交通实时监控项目5.mp4
第148节 ELK-Beats&Logstash介绍.mp4
第149节 ELK-Lostash架构实战.mp4
第150节 交通实时监控项目6.mp4
第151节 ELK-收集Nginx日志,syslog,kibana讲解.mp4
第152节 交通实时监控项目7.mp4
第153节 ELK-使用Packetbeat监控es集群.mp4
第154节 ES进阶-relevance score原理及排序算法优化.mp4
第155节 ES进阶-Nested、Join及Term vector详解.mp4
第156节 ES进阶-Highlight及Suggest搜索推荐详解.mp4
第157节 ES进阶-深入探秘基于地理位置搜索.mp4
第158节 ES进阶-案例分析:基于地理位置搜索的疫情地图.mp4
第159节 ES进阶-深入聚合分析-多metric以及histogram剖析.mp4
第160节 ES进阶-深入聚合搜索-完结.mp4
第161节 ES进阶-运维篇之集群管理.mp4
第162节 ES进阶-运维篇之集群管理2以及hdfs安装.mp4
第163节 ES进阶-基于snapshot hdfs restore数据备份还原.mp4
第164节 ES进阶-索引管理-1.mp4
第165节 ES进阶-索引管理-2.mp4
第166节 ES进阶-集群安全.mp4
第167节 项目实战-搜索引擎框架原理.mp4
第168节 项目实战-搜索推荐项目案例.mp4
第169节 数据仓库之数据库范式与ER实体关系模型建模.mp4
第170节 数据仓库之维度建模与数据仓库分析模型.mp4
第171节 数据仓库之数据仓库分层设计与命名规范.mp4
第172节 音乐数仓平台之项目架构及数仓分层、主题设计.mp4
第173节 数仓之歌曲影响力指数分析.mp4
第174节 数仓之歌手影响力指数分析.mp4
第175节 数仓之Sqoop全量增量数据导入.mp4
第176节 数仓之Azkaban任务流调度使用及原理.mp4
第177节 数仓之Superset BI可视化工具使用及原理.mp4
第178节 数仓之机器详情ODS.EDS.DM分层设计.mp4
第179节 数仓之机器详情自动化调度及数据可视化.mp4
第180节 数仓之用户画像表模型设计.mp4
第181节 数仓之用户画像自动化调度及数据可视化.mp4
第182节 数仓之高德api获取机器上报位置.mp4
第183节 数仓之商户、地区营收统计分析.mp4
第184节 数仓之营收分析自动化调度及数据可视化.mp4
第185节 数仓之实时用户、机器日志采集接口实现.mp4
第186节 数仓之Flume实时日志采集实现.mp4
第187节 数仓之实时用户地区日活分析.mp4
第188节 Cloudera Manager CDH 平台 01.mp4
第189节 Cloudera Manager CDH 平台 02.mp4
第190节 Cloudera Manager CDH 平台 03.mp4
第191节 Apache Kylin分析性数据仓库 01.mp4
第192节 Apache Kylin分析性数据仓库 02.mp4
第193节 Apache Kylin分析性数据仓库 03.mp4
第194节 ClickHouse 使用场景、特性与分布式搭建.mp4
第195节 ClickHouse 数据类型详解.mp4
第196节 ClickHouse 数据库引擎分类及操作.mp4
第197节 ClickHouse 表引擎分类及MergeTree引擎详解.mp4
第198节 ClickHouse 视图与SQL语法操作.mp4
第199节 Kudu分布式存储引擎架构原理及搭建.mp4
第200节 Kudu API操作及与其他框架整合.mp4
第202节 Spark操作Kudu & Flink操作Kudu.mp4
第203节 NiFi数据处理分发系统-特性、架构原理与集群搭建.mp4
第204节 NiFi数据处理分发系统-Processors介绍及页面操作.mp4
第205节 NiFi数据处理分发系统-实时同步日志、MySQL数据到Hive.mp4
第206节 NiFi数据处理分发系统-实时监控日志数据写入Kafka及消费Kafka.mp4
第207节 NiFi 案例分析.mp4
第208节 NiFi 案例分析2.mp4
第209节 数据治理-数据质量管理.mp4
第210节 数据治理-元数据管理.mp4
第211节 数据治理-数据安全管理.mp4
第212节 ETL工具Kettle-安装及基本操作.mp4
第213节 ETL工具Kettle-转换核心.作业对象.mp4
第214节 ETL工具Kettle-案例分析.mp4
第215节 ETL工具Kettle-案例分析02.mp4
第216节 ETL工具Kettle-案例分析03.mp4
第218节 数据同步工具Canal&Maxwell.mp4
第219节 Phoenix-搭建及基本操作.mp4
第220节 Phoenix-二级索引及JDBC连接.mp4
第221节 实时数仓项目-实时数仓架构演变及建设思路.mp4
第222节 实时数仓项目-各大公司实时数仓实践分享及项目介绍.mp4
第223节 实时数仓项目-实时数仓项目业务数据及日志数据处理.mp4
第224节 实时数仓项目-实时数仓业务库数据Flink编程处理.mp4
第225节 实时数仓项目-实时数仓维度数据Flink编程处理.mp4
第226节 实时数仓项目-实时数仓实时统计歌曲和歌手热度.mp4
第227节 实时数仓项目-Flink代码DM层处理及可视化展示.mp4
第228节 实时数仓项目-guava包冲突解决及用户上报位置实时统计.mp4
第229节 实时数仓项目-用户实时登录信息可视化及营收信息业务分析.mp4
第230节 时数仓项目-营收业务Flink代码实现及可视化展示.mp4
第231节 实时数仓项目-实时数仓项目总结.mp4
第232节 Hudi表类型与查询类型.mp4
第233节 Hudi与Spark、Hive、Flink集成.mp4
第234节 Apache Druid实时分析型数据库.mp4
第235节 项目轮播-数据仓库之数据库范式与ER实体关系模型建模.mp4
第236节 项目轮播-数据仓库之维度建模与数据仓库分析模型.mp4
第237节 项目轮播-数据仓库之数据仓库分层设计与命名规范.mp4
第238节 项目轮播-音乐数仓平台之项目架构及数仓分层、主题设计.mp4
第239节 项目轮播-数仓平台业务之歌曲影响力指数分析.mp4
第240节 项目轮播-数仓业务之歌手影响力指数分析.mp4
第241节 项目轮播-Azkaban任务流调度使用及原理.mp4
第242节 项目轮播-Superset BI可视化工具使用及原理.mp4
第243节 项目轮播-数仓平台业务之机器详情ODS.EDS.DM分层设计.mp4
第244节 项目轮播-数仓平台业务之机器详情自动化调度及数据可视化.mp4
第245节 项目轮播-数仓平台业务之用户画像表模型设计.mp4
第246节 项目轮播-数仓平台业务之用户画像自动化调度及数据可视化.mp4
第247节 项目轮播-数仓平台业务之高德api获取机器上报位置.mp4
第248节 项目轮播-数仓平台业务之商户、地区营收统计分析.mp4
第249节 项目轮播-数仓平台业务之营收分析自动化调度及数据可视化.mp4
第250节 项目轮播-数仓平台业务之实时用户、机器日志采集接口实现.mp4