Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 河北交通投资集团有限公司;河北省交通规划设计研究院有限公司;东南大学何勇海获国家专利权

河北交通投资集团有限公司;河北省交通规划设计研究院有限公司;东南大学何勇海获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉河北交通投资集团有限公司;河北省交通规划设计研究院有限公司;东南大学申请的专利一种考虑鲁棒性的干线交叉口协同控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120279737B

龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510380116.0,技术领域涉及:G08G1/081;该发明授权一种考虑鲁棒性的干线交叉口协同控制方法是由何勇海;雷伟;焦彦利;高静雅;韩明敏;朱大安;李昊;刘攀;李志斌;徐铖铖设计研发完成,并于2025-03-28向国家知识产权局提交的专利申请。

一种考虑鲁棒性的干线交叉口协同控制方法在说明书摘要公布了:本发明旨在提供一种考虑鲁棒性的干线交叉口协同控制方法,属于智能交通控制技术领域,方法包括以下步骤:构建多智能体干线交叉口系统,将每个交叉口视为独立智能体;进行干线交叉口鲁棒性配置,引入鲁棒性优化策略,建立交通流量不确定性波动模型,设定鲁棒性目标与约束条件;搭建鲁棒性干线多智能体网络框架,定义鲁棒联合交通状态空间、动作控制参数及鲁棒奖励函数;采用深度强化学习算法训练智能体,构建考虑鲁棒性的多智能体深度确定策略梯度算法;以及通过在线学习与自适应调整,根据实时交通数据优化控制策略。本发明通过鲁棒性设置和智能体协同控制,提升了干线交叉口在复杂交通环境下的适应性和稳定性,具有良好的可扩展性。

本发明授权一种考虑鲁棒性的干线交叉口协同控制方法在权利要求书中公布了:1.一种考虑鲁棒性的多智能体干线交叉口信号协同控制方法,其特征在于,包括如下步骤: 步骤S1、多智能体干线交叉口系统构建:将交通干线上的每个交叉口视为一个智能体,所述智能体实时获取实时交通数据,并进行数据清洗和特征提取,为后续不确定性波动模型建模提供输入; 步骤S2、干线交叉口鲁棒性配置:进行干线交通流量不确定性波动模型建模、鲁棒性目标设定和鲁棒性约束条件构建,具体包括: 步骤S21、干线交通流量不确定性波动建模:考虑车辆到达率、道路状况、天气条件以及实时环境因素的影响,构建基于深度强化学习的鲁棒性建模策略,引入负二项移动平均随机化算法,通过以下公式进行干线交通流量不确定性波动建模: ,其中,是干线最大交通流量;是单位时间到达的车辆数;是单位时间到达辆车的概率;是干线最大交通流量与单位时间到达的车辆的差值;为车辆到达波动参数;为天气条件参数;为道路状况变化参数;为环境感知信息参数; 步骤S22、鲁棒性目标设定,设定最小化车辆延误和交通拥堵程度作为鲁棒性目标,根据实时感知数据动态调整目标函数的参数,鲁棒性目标函数为: ,其中,是不确定性波动交通流量,是干线最大交通流量,是交叉口红灯时间,是鲁棒性参数,是车辆延误鲁棒参数,是交通拥堵程度鲁棒参数,为不确定波动交通流量下的干线平均速度; 步骤S23、鲁棒性约束条件,设定红灯时间在范围内波动; 步骤S3、鲁棒性多智能体模型配置:通过步骤S2中的交通流量不确定性波动模型、鲁棒性目标设定和鲁棒性约束条件搭建鲁棒性干线多智能体网络框架,定义鲁棒联合交通状态空间、动作控制参数及鲁棒奖励函数,具体包括: 步骤S31、搭建鲁棒性干线多智能体网络框架,以中心式学习方式更新所述智能体的策略网络参数,并通过分布式执行方式输出控制动作; 步骤S32、鲁棒联合交通状态空间定义,所述鲁棒联合交通状态空间定义为: ,其中,表示智能体第相位在上一控制周期内的最大排队长度;表示智能体第相位在上一控制周期内最大排队长度所对应的车辆数;表示智能体第相位在上一控制周期内的单位时间到达流率,为道路容量;表示智能体的相邻智能体第相位在上一控制周期内的最大排队长度;表示智能体的相邻智能体第相位在上一控制周期内最大排队长度所对应的车辆数;表示智能体的相邻智能体第相位在上一控制周期内的单位时间到达流率;是鲁棒性参数;是车辆延误鲁棒参数;是交通拥堵程度鲁棒参数; 步骤S33、鲁棒动作控制参数定义,所述鲁棒动作控制参数定义为: ,其中,表示智能体的第个相位的绿灯时长与周期时长的比值,是鲁棒性参数; 步骤S34、鲁棒奖励函数定义,所述鲁棒奖励函数定义为: ,其中,表示智能体第相位在上一控制周期内的到达流量;表示智能体第相位在上一控制周期内的平均车辆延误;表示智能体第相位在上一控制周期内的到达流量;表示智能体第相位在上一控制周期内的平均车辆延误;是鲁棒性目标函数; 步骤S4、干线交叉口协同控制策略配置:将所述鲁棒联合交通状态空间和动作控制参数作为深度强化学习算法的输入,以设计智能体的观察空间和动作选择策略,采用深度强化学习算法对所述智能体进行多智能体协同训练,构建考虑鲁棒性的多智能体深度确定策略梯度算法CR‑MADDPG,并将所述鲁棒奖励函数嵌入,以驱动所述智能体学习鲁棒性策略,实现全局鲁棒性优化; 步骤S5、在线学习与自适应调整:以步骤S4中的CR‑MADDPG算法作为初始策略进行在线学习,根据实时交通数据进行经验收集,并随机抽取批量样本进行所述智能体的网络参数更新,以进行在线学习的策略微调。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河北交通投资集团有限公司;河北省交通规划设计研究院有限公司;东南大学,其通讯地址为:050090 河北省石家庄市桥西区新石北路52号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。