中国科学技术信息研究所--国家工程技术数字图书馆

有限阶段马尔可夫决策的可变限速控制模型 北大核心 CSCD CSTPCD

[期刊]

原文获取收藏分享

摘要 : 分析了高速公路主线可变限速控制的作用,研究了现有的限速方法,将高速公路主线可变限速控制过程看作是离散时间的马尔可夫决策过程,提出基于强化学习与有限阶段马尔可夫决策的可变限速控制模型,通过与交通环境的交互学习进行模型的动态调整。采用有限... 展开

作者	王薇杨兆升赵丁选
作者单位	吉林大学交通学院吉林长春130025 + - 所属机构：吉林大学吉林大学机械科学与工程学院吉林长春130025 + - 所属机构：吉林大学
英文名称	Control model of variable speed limit based on finite horizon Markov decision-making
期刊名称	《交通运输工程学报》
期刊英文名称	《Journal of Traffic and Transportation Engineering》
页码/总页数	109-114 / 6
语种/中图分类号	汉语 / U491
关键词	交通信息工程可变限速控制马尔可夫决策强化学习高速公路主线
基金项目	国家863计划项目（2009AA11Z218 2009AA11Z208）;吉林省科技发展计划项目（20100176）;吉林大学基本科研业务费科学前沿与交叉学科创新项目
收录情况	BDHX CSCD CSTPCD
机标主题词 / 分类号	高速公路;可变限速控制;马尔可夫决策 / U412.366;TP13;O211.62