摘要 : 针对双足机器人在未知环境行走过程中步态不稳的问题,提出了一种基于近端策略优化(proximal policy optimization,PPO)的双足机器人控制方法.首先,构建动作网络和价值网络,引入长短时记忆(long short-term memory,LSTM),以缩小双足机器人与未知环境交... 展开
作者 | 吴万毅 刘芳华 郭文龙 |
---|---|
作者单位 | |
英文名称 | Adaptive walking control for bipedal robots based on enhanced PPO algorithm |
期刊名称 | 《扬州大学学报(自然科学版)》 |
期刊英文名称 | 《Journal of Yangzhou University(Natural Science Edition)》 |
页码/总页数 | 44-50 / 7 |
语种/中图分类号 | 汉语 / TP181 TP242.6 |
关键词 | 近端策略优化算法 长短时记忆 注意力机制 双足行走机器人 神经网络 |
DOI | 10.19411/j.1007-824x.2023.06.008 |
基金项目 | 国家自然科学基金资助项目(62002141). |
机标主题词 / 分类号 | 双足机器人;网络;策略优化 / TP24;N94;TP311.53 |