Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西北工业大学方振宇获国家专利权

西北工业大学方振宇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西北工业大学申请的专利一种基于多智能体深度强化学习的交通信号优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120599840B

龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511108992.4,技术领域涉及:G08G1/07;该发明授权一种基于多智能体深度强化学习的交通信号优化方法是由方振宇;杨浩伟;郑江滨;马佳曼;王君波设计研发完成,并于2025-08-08向国家知识产权局提交的专利申请。

一种基于多智能体深度强化学习的交通信号优化方法在说明书摘要公布了:本发明公开了一种基于多智能体深度强化学习的交通信号优化方法,属于交通信号控制技术领域,包括如下步骤:根据车辆运行数据对车辆进行追踪和轨迹仿真,并构建城市交通仿真模型及各交叉口的交通信号灯对应的强化智能学习体;构建上下文增强状态空间,并对上下文状态空间中的特征参数进行归一化处理,并组合得到实时交通环境状态向量;计算得到拥堵指数自适应奖励;根据启发式奖励塑形方法,定义流量匹配度指标和指示信号周期位置奖励,并结合拥堵指数自适应奖励,得到交通信号优化奖励;根据交通信号优化奖励,采用多智能体双深度Q网络训练强化智能学习体控制交通信号相位切换。本发明解决了复杂场景下交通信号控制灵活性和效率不足的问题。

本发明授权一种基于多智能体深度强化学习的交通信号优化方法在权利要求书中公布了:1.一种基于多智能体深度强化学习的交通信号优化方法,其特征在于,包括如下步骤: S1、根据车辆运行数据对车辆进行追踪和轨迹仿真,并构建城市交通仿真模型及各交叉口的交通信号灯对应的强化智能学习体; S2、构建上下文增强状态空间,并对上下文增强状态空间中的特征参数进行归一化处理,并组合得到实时交通环境状态向量; S3、基于城市交通仿真模型中各交叉口的基础奖励指标,动态调整基础奖励指标的权重,并计算得到拥堵指数自适应奖励; 所述S3包括如下步骤: S31、基于城市交通仿真模型中各交叉口的基础奖励指标,计算得到交叉口的实时交通拥堵指数,其中,基础奖励指标包括实时等待时间、实时排队长度、实时平均速度和实时路口压力; 所述交叉口的实时交通拥堵指数的计算表达式如下: ,其中,表示交叉口的实时交通拥堵指数,表示交叉口的实时等待时间,表示交叉口的实时排队长度,表示交叉口的实时平均速度,表示交叉口的实时路口压力; S32、根据交叉口的实时拥堵指数,动态调整基础奖励指标的权重; 所述基础奖励指标的权重的计算表达式如下: ,,,,,其中,表示实时等待时间的权重,表示实时拥堵指数调节因子,表示实时排队长度的权重,表示实时平均速度的权重,表示实时路口压力的权重; S33、基于基础奖励指标的权重,计算得到拥堵指数自适应奖励; 所述拥堵指数自适应奖励的计算表达式如下: ,其中,表示拥堵指数自适应奖励,表示等待时间奖励,表示排队长度奖励,表示平均速度奖励,表示路口压力奖励; S4、根据启发式奖励塑形方法,定义流量匹配度指标和指示信号周期位置奖励,并结合拥堵指数自适应奖励,得到交通信号优化奖励; 所述S4包括如下步骤: S41、根据启发式奖励塑形方法,定义流量匹配度指标; 所述流量匹配度指标的计算表达式如下: ,其中,表示流量匹配度指标,表示交叉口南北方向实时流量,表示交叉口东西方向实时流量,表示防止分母为零的常数,表示南北方向绿灯,表示东西方向绿灯; S42、基于流量匹配度指标,设置流量匹配奖励; 所述流量匹配奖励的计算表达式如下: ,,,其中,表示流量匹配奖励,表示主导方向控制强度,表示主导相位方向数,表示主导方向控制强度系数,表示当前相位方向归一化因子,表示时段指示变量; S43、定义指示信号周期位置奖励; 所述指示信号周期位置奖励的计算表达式如下: ,其中,表示指示信号周期位置奖励,表示强度调节正系数,表示当前绿灯持续时长相对最小绿灯时长的归一化比值; S44、基于拥堵指数自适应奖励函数、流量匹配奖励和指示信号周期位置奖励,计算得到交通信号优化奖励; 所述交通信号优化奖励的计算表达式如下: ,其中,表示交通信号优化奖励; S5、根据交通信号优化奖励,采用多智能体双深度Q网络训练强化智能学习体控制交通信号相位切换。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。