中国科学技术信息研究所--国家工程技术数字图书馆

基于策略梯度的深度强化学习算法优化

[学位论文]

钟颖嘉
电子科技大学

原文获取收藏分享

摘要: 强化学习是机器学习领域的一个重要分支，它通过模拟生命体大脑的学习思维模式来学习行动策略。与传统的学习方法不同，强化学习中的智能体在学习时不被直接告知需要采取哪些行动，而是得到这些行动带来的即时奖励学习一个策略最大化这些奖励。通过“试... 展开

作者	钟颖嘉	授予学位单位	电子科技大学
导师	朱清新	学位	硕士
学科	软件工程	国籍	CN
页码/总页数	1-84 / 84	出版年	2021
中图分类号	TP181
关键词	深度强化学习策略梯度 DDPG算法 TD3算法
机标主题词	算法;强化学习算法;网络
机标分类号	TP301.6;TP18;N94
馆藏号	D02411957

相关论文

基于深度强化学习的策略模型及其应用研究

插电式混合动力汽车复合储能系统设计及能量管理与优化研究

离线与在线混合策略的深度强化学习算法研究与实现

基于深度强化学习的相机位姿控制策略研究

基于深度强化学习的移动机器人自主路径规划研究

相关机构

杭州电子科技大学

电子科技大学

华北电力大学（北京）

华东交通大学

相关作者

相关关键词