强化学习  060733

  • 开课时间: 2023-02-20 学习人数: 52人
  • 学分: 3 学分
教学安排
  • 开课时间: 2023-02-20
课程介绍
《强化学习》是江苏开放大学本科人工智能专业的选修课程。通过课程的学习,使学员掌握强化学习的基本理论和基本知识,了解强化学习这门学科的各类问题和方法论,主要包括强化学习的基本概念、最优控制问题的求解、基于价值的强化学习算法(Sarsa、Q-learning、DQN)、基于策略的强化学习算法(策略梯度)等主要算法。此外,本课程强调学生的动手能力,要求学生通过编程练习和典型应用实例加深理解,同时掌握强化的实验环境Gym、实验工具Tensorflow的使用以及基础的Python语言编程技能,为学习后续专业课程《数据挖掘技术》等奠定基础。 收起
教学目标
    1. 通过课程学习,学员能够根据强化学习的基本要素知识,正确的对马尔可夫决策过程进行定义及分类,对强化学习及其应用有概览性的认识。
    2. 通过课程学习,学员能够利用目前主流的强化学习算法和模型,选择相应的算法解决实际问题。
    3. 通过课程学习,学员能够正确使用强化学习实验环境Gym工具,并能够编程完成典型的应用实例,对强化学习案例有初步的编程训练。
    4. 通过课程学习,学员能够通过团队合作完成一项强化学习项目,并做展示与交流。

参考教材
强化学习
邹伟,鬲玲,刘昱杓
清华大学出版社
2020-06-01
9787302538295
96.03
启用
http://product.dangdang.com/682453700.html
复制地址
2022-06-14
考核指标
100%
0%
0%
0
0
0
单元 活动 名称 权重 满分要求
内容学习 10 300分钟
第一单元 强化学习概述 话题讨论 ★★BBS:你知道与强化学习相关的人工智能技术有哪些吗?(总成绩占比5%) 5 1个回帖
第三单元 最优控制 在线作业 ★★形考作业1(总成绩占比10%) 10 100分
第四单元 Q-learning 话题讨论 ★★BBS:当下强化学习遇到了哪些困境?(总成绩占比5%) 5 1个回帖
第五单元 强化学习的实验工具和环境 在线作业 ★★形考作业2(总成绩占比15%) 15 100分
第七单元 Actor-Critic 在线作业 ★★形考作业3(总成绩占比15%) 15 100分
课程总结 在线作业 ★★综合大作业(占比40%) 40 100分
考试安排(具体时间以实际准考证为准)