摘要 : 为优化串联式混合动力履带车辆(SHETV)的燃油经济性和动力电池性能,提出一种基于优先经验采样的双延迟深度确定性策略梯度(TD3-PER)能量管理策略。TD3算法能实现更精准的连续控制和防止训练陷入过优估计。优先经验采样(PER)算法可加速策略的训练和获得... 展开
作者 | 张彬 邹渊 张旭东 杜国栋 孙文景 孙巍 |
---|---|
作者单位 | |
期刊名称 | 《汽车工程》 |
期刊英文名称 | 《Automotive Engineering》 |
页码/总页数 | P.1400-1409 / 10 |
语种/中图分类号 | 汉语 / U469.7 |
关键词 | 串联式混合动力履带车辆 双延迟深度确定性策略梯度 连续控制 优先经验采样 |
DOI | 10.19562/j.chinasae.qcgc.2022.09.011 |
基金项目 | 国家自然科学基金(51775039)资助。 |
收录情况 | BDHX CSCD CSTPCD |