中国科学技术信息研究所--国家工程技术数字图书馆

未来信息辅助的深度强化学习算法研究

[学位论文]

常芳芳
厦门大学

原文获取收藏分享

摘要: 深度强化学习在众多领域都取得了巨大的成功。目前，大多数深度强化学习方法都是基于历史信息进行规划，这类方法没有考虑到未来信息对决策过程可能起到指导的作用。此外，现有利用未来信息进行规划的方法，其通常的做法是建立环境模型，进而利用模型... 展开

作者	常芳芳	授予学位单位	厦门大学
导师	刘云龙	学位	硕士
学科	控制工程	国籍	CN
页码/总页数	1-69 / 69	出版年	2021
中图分类号	TP18
关键词	对比预测编码深度Q学习算法未来信息
机标主题词	信息;算法;观测环境
机标分类号	G25;TP301.6;P11
馆藏号	Y3856500

相关论文

基于深度强化学习的城轨列车ATO智能控制策略研究

基于卷积神经网络的说话人识别系统研究

面向序列的个性化推荐算法研究

基于自监督对比学习的文字识别方法研究

相关机构

兰州交通大学

厦门理工学院

黑龙江大学

中国科学技术大学

相关作者

相关关键词