摘要 : 分析了高速公路主线可变限速控制的作用,研究了现有的限速方法,将高速公路主线可变限速控制过程看作是离散时间的马尔可夫决策过程,提出基于强化学习与有限阶段马尔可夫决策的可变限速控制模型,通过与交通环境的交互学习进行模型的动态调整。采用有限... 展开
作者 | 王薇 杨兆升 赵丁选 |
---|---|
作者单位 | |
英文名称 | Control model of variable speed limit based on finite horizon Markov decision-making |
期刊名称 | 《交通运输工程学报 》 |
期刊英文名称 | 《Journal of Traffic and Transportation Engineering》 |
页码/总页数 | 109-114 / 6 |
语种/中图分类号 | 汉语 / U491 |
关键词 | 交通信息工程 可变限速控制 马尔可夫决策 强化学习 高速公路主线 |
基金项目 | 国家863计划项目(2009AA11Z218 2009AA11Z208);吉林省科技发展计划项目(20100176);吉林大学基本科研业务费科学前沿与交叉学科创新项目 |
收录情况 | BDHX CSCD CSTPCD |
机标主题词 / 分类号 | 高速公路;可变限速控制;马尔可夫决策 / U412.366;TP13;O211.62 |