在线客服
微信扫码
返回顶部
客服

强化学习工程师 强化学习工程师深度实战课程

爱不悔 爱不悔
来源:知丰

课程下载

提取码:t5r6
检测百度分享链接是否有效: 检测报错
网盘转存下载
本课程供VIP会员免费学习。
下载途径:共1.90 GB,网盘转存下载。

课程介绍

强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

课程内容从强化学习的基础到进阶实战,每个阶段都有非常详细的指导和教学,可以很好的加深同学们对强化学习框架,网络流程,运行策略的理解,从宏观到细节,特别细致,对于想要快速在工作中运用强化学习的同学很有帮助。

课搜搜网络技术教程下载观看

强化学习工程师-强化学习工程师深度实战课程目录如下:

1-2 一张图通俗解释强化学习.mp4

1-3 强化学习的指导依据.mp4

1-4 强化学习AI游戏DEMO.mp4

1-5 应用领域简介.mp4

1-6 强化学习工作流程.mp4

1-7 计算机眼中的状态与行为.mp4

2-1 基本情况介绍.mp4

2-2 与环境交互得到所需数据.mp4

2-3 要完成的目标分析.mp4

2-4 策略梯度推导.mp4

2-5 baseline方法.mp4

2-6 OnPolicy与OffPolicy策略.mp4

2-7 importance sampling的作用.mp4

2-8 PPO算法整体思路解析.mp4

3-1 Critic的作用与效果.mp4

3-2 PPO2版本公式解读.mp4

3-3 参数与网络结构定义.mp4

3-4 得到动作结果.mp4

3-5 奖励获得与计算.mp4

3-6 参数迭代与更新.mp4

4-1 算法原理通俗解读.mp4

4-2 目标函数与公式解析.mp4

4-3 Qlearning算法实例解读.mp4

4-4 Q值迭代求解.mp4

4-5 DQN简介.mp4

5-1 整体任务流程演示.mp4

5-2 探索与action获取.mp4

5-3 计算target值.mp4

5-4 训练与更新.mp4

6-1 DoubleDqn要解决的问题.mp4

6-2 DuelingDqn改进方法.mp4

6-3 Dueling整体网络架构分析.mp4

6-4 MultiSetp策略.mp4

6-5 连续动作处理方法.mp4

7-1 AC算法回顾与知识点总结.mp4

7-2 优势函数解读与分析.mp4

7-3 计算流程实例.mp4

7-4 A3C整体架构分析.mp4

7-5 损失函数整理.mp4

8-1 整体流程与环境配置.mp4

8-2 启动游戏环境.mp4

8-3 初始化局部模型并加载参数.mp4

8-4 要计算的指标回顾.mp4

8-5 与环境交互得到训练数据.mp4

8-6 训练网络模型.mp4

9-1 卷积神经网络应用领域.mp4

9-10 VGG网络架构.mp4

9-11 残差网络Resnet.mp4

9-12 感受野的作用.mp4

9-2 卷积的作用.mp4

9-3 卷积特征值计算方法.mp4

9-4 得到特征图表示.mp4

9-5 步长与卷积核大小对结果的影响.mp4

9-6 边缘填充方法.mp4

9-7 特征图尺寸计算与参数共享.mp4

9-8 池化层的作用.mp4

9-9 整体网络架构.mp4

10-1 PyTorch框架发展趋势简介.mp4

10-2 框架安装方法(CPU与GPU版本).mp4

10-3 PyTorch基本操作简介.mp4

10-4 自动求导机制.mp4

10-5 线性回归DEMO-数据与参数配置.mp4

10-6 线性回归DEMO-训练回归模型.mp4

10-7 常见tensor格式.mp4

10-8 Hub模块简介.mp4

11-1 卷积网络参数定义.mp4

11-10 加载训练好的网络模型.mp4

11-11 优化器模块配置.mp4

11-12 实现训练模块.mp4

11-13 训练结果与模型保存.mp4

11-14 加载模型对测试数据进行预测.mp4

11-15 额外补充-Resnet论文解读.mp4

11-16 额外补充-Resnet网络架构解读.mp4

11-2 网络流程解读.mp4

11-3 Vision模块功能解读.mp4

11-4 分类任务数据集定义与配置.mp4

11-5 图像增强的作用.mp4

11-6 数据预处理与数据增强模块.mp4

11-7 Batch数据制作.mp4

11-8 迁移学习的目标.mp4

11-9 迁移学习策略.mp4

相邻课程

阅读 下载数 55
爱不悔
爱不悔
认证课程发布者
关注发布者
爱不悔
爱不悔
认证课程发布者
课程数
粉丝数
关注发布者
栏目专题
user-avatar
Python编程
Python是多数平台上快速开发应用的编程语言。
user-avatar
影音剪辑
剪辑既是影片制作工艺过程中一项必不可少的工作。
user-avatar
投资基金
基金主要投资大盘蓝筹股,与股市是同涨同跌的关系。
user-avatar
微信视频号
微信视频号内容以图片和视频为主,可以发布长度不超过1分钟的视频。
user-avatar
高中课程
高中(Senior high school),是高级中学的简称。
名人推荐
user-avatar
陈安之
中国著名的成功学演讲大师。
user-avatar
柳传志
中国联想控股、联想集团创始人。
user-avatar
刘强东
京东集团董事局主席兼首席执行官。
user-avatar
杜云生
亚洲创富教育、销售培训讲师。
user-avatar
钱文忠
复旦大学历史系教授,百家讲坛嘉宾。