欢迎学习《2022基于深度强化学习和PyTorch人工智能 (AI) 代理开发视频教程》课程,你将学习使用深度强化学习和PyTorch构建人工智能 (AI) 代理:DDPG、TD3、SAC、NAF、HER。
这是Udemy上最全面的高级强化学习课程之一。在其中,您将学习使用 PyTorch 和 PyTorch 闪电在 Python 中实现一些最强大的深度强化学习算法。您将从头开始实施根据经验解决控制任务的自适应算法。您将学习将这些技术与神经网络和深度学习方法相结合,以创建能够解决决策任务的自适应人工智能代理。
本课程将向您介绍强化学习技术的最新技术。它还将为您准备本系列的下一个课程,我们将在其中探索在其他类型的任务中表现出色的其他高级方法。
MP4 | 视频:h264, 1280×720 | 音频:AAC,44.1 KHz
语言:英语 | 大小:2.41 GB | 时长:8h 5m
你会学到什么
- 掌握一些最先进的强化学习算法。
- 了解如何创建可以在复杂环境中行动以实现其目标的 AI。
- 使用 Python 最流行的工具( PyTorch Lightning、OpenAI gym、Brax、Optuna)从头开始创建高级强化学习代理
- 了解如何执行超参数调整(为我们的 AI 学习选择最佳实验条件)
- 从根本上了解每种算法的学习过程。
- 调试和扩展所提供的算法。
- 从研究论文中理解和实施新算法。
要求
熟悉 Python 编程
完成我们的“强化学习初学者到掌握”课程或熟悉强化学习的基础知识(或观看本课程中包含的练级部分)。
了解基本统计数据(均值、方差、正态分布)
描述
该课程的重点是培养实践技能。因此,在学习了每个方法家族最重要的概念之后,我们将从头开始在 jupyter notebook 中实现它们的一种或多种算法。
调平模块:
– 复习:马尔可夫决策过程 (MDP)。
– 复习:Q-Learning。
– 复习:神经网络简介。
– 复习:深度 Q 学习。
– 复习:策略梯度方法
高级强化学习
– PyTorch Lightning。
– 使用 Optuna 进行超参数调整。
– 连续动作空间的深度 Q 学习(归一化优势函数 – NAF)。
– 深度确定性策略梯度 (DDPG)。
– 双延迟 DDPG (TD3)。
– 软演员-评论家 (SAC)。
– 事后经验回放 (HER)。
本课程适用于谁
猜你喜欢
- Python实用神经网络和深度学习算法全面指南视频教程 (0.921)
- Python自动驾驶汽车应用设计开发中深度学习和计算机视觉视频教程 (0.896)
- 强化学习AI技术Python智能应用软件开发视频教程 (0.886)
本站资源仅供下载者学习技术,版权归资源原作者所有,请在下载后24小时之内自觉删除。
本站资源仅供下载者学习IT编程开发技术,请遵守国家法律法规,严禁用于非法用途。
若作商业用途,请购买正版,由于未及时购买正版发生的侵权行为,与本站无关。
如您是版权方,本站源码有侵犯到您的权益,请邮件联系331752841@qq.com 删除,我们将及时处理!