[学位论文]
  • 常芳芳
  • 厦门大学

摘要: 深度强化学习在众多领域都取得了巨大的成功。目前,大多数深度强化学习方法都是基于历史信息进行规划,这类方法没有考虑到未来信息对决策过程可能起到指导的作用。此外,现有利用未来信息进行规划的方法,其通常的做法是建立环境模型,进而利用模型... 展开

作者 常芳芳   授予学位单位 厦门大学  
导师 刘云龙 学位 硕士
学科 控制工程   国籍 CN
页码/总页数 1-69 / 69 出版年 2021
中图分类号 TP18
关键词 对比预测编码   深度Q学习算法   未来信息  
机标主题词 信息;算法;观测环境
机标分类号 G25;TP301.6;P11
馆藏号 Y3856500
相关作者
相关关键词