吉林大学别一鸣获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉吉林大学申请的专利考虑交叉口异质性的多智能体强化学习交通信号协同控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118038692B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410164028.2,技术领域涉及:G08G1/081;该发明授权考虑交叉口异质性的多智能体强化学习交通信号协同控制方法是由别一鸣;季毓婷;季金华;王天贺;从远设计研发完成,并于2024-02-05向国家知识产权局提交的专利申请。
本考虑交叉口异质性的多智能体强化学习交通信号协同控制方法在说明书摘要公布了:考虑交叉口异质性的多智能体强化学习交通信号协同控制方法,本发明属于城市交通信号控制领域,具体涉及交通信号协同控制方法。本发明的目的是为了解决现有交叉口通行效率低的问题。过程为:数据采集;仿真平台搭建及初始化;多智能体深度强化学习网络搭建及初始化;将仿真平台输出的交叉口的交通状态、路网的交通状态、奖励函数作为多智能体深度强化学习网络的输入,输出各交叉口的个体动作函数值,确定动作反馈给仿真平台,仿真平台Δt秒后再次输出交叉口的交通状态、路网的交通状态、奖励函数;获得训练好的多智能体深度强化学习网络;将实际交叉口的交通状态输入网络,输出个体动作函数值,选择最优动作下发到交叉口。
本发明授权考虑交叉口异质性的多智能体强化学习交通信号协同控制方法在权利要求书中公布了:1.考虑交叉口异质性的多智能体强化学习交通信号协同控制方法,其特征在于:所述 方法具体过程为: 步骤1、数据采集; 步骤2、仿真平台搭建及初始化; 步骤3、多智能体深度强化学习网络搭建及初始化; 步骤4、将仿真平台输出的交叉口的交通状态、路网的交通状态、奖励函数作为多智能体深度强化学习网络的输入,多智能体深度强化学习网络输出各交叉口的个体动作函数值,基于多智能体深度强化学习网络输出的各交叉口的个体动作函数值确定动作,将动作经仿真平台软件中的Traci交通控制接口反馈给仿真平台,仿真平台秒后再次输出交叉口的交通状态、路网的交通状态、奖励函数; 步骤5、重复执行步骤4对多智能体深度强化学习网络进行训练,直至收敛,获得训练好的多智能体深度强化学习网络; 训练好的多智能体深度强化学习网络包括: 训练好的多智能体深度强化学习评估网络和训练好的多智能体深度强化学习目标网络; 步骤6、将实际路网在时刻交叉口i的交通状态输入训练好的多智能体深度强化学习评估网络,输出交叉口i在时刻的个体动作函数值; 基于个体动作函数值选择最优动作,将最优动作下发到交叉口i; 所述步骤1中数据采集;具体过程为: 步骤1.1、将协同控制范围内的交叉口记为i,交叉口i为路交叉口,表示交叉口i的邻接交叉口集合,I表示路网中的交叉口个数; 将交叉口i的进口车道数记为,; 将交叉口i的进口车道长度记为,单位为m,,表示交叉口i的某个进口车道; 将交叉口i的出口车道数记为; 将交叉口i的出口车道长度记为,单位为m,,表示交叉口i的某个出口车道; 令表示交叉口i的信号相位数,将相位在每周期的绿灯显示时间记为,; 步骤1.2、用变量u表示交通时段,表示高峰时段,表示平峰时段; 利用交通检测设备统计交叉口i连续一个星期内高峰时段及平峰时段的交通流量,并汇总为真实数据集,将交叉口i的小时交通量记为,,单位为辆; 步骤1.3、定义交叉口相位的车流数为F,利用下式计算交叉口相位的关键车流; 1 式中,、、分别为车流1、2、F的平均小时交通量,单位为辆; 为取最大值操作;为取下标操作; 将所行驶的车道定义为; 将的小时交通量记为,单位为辆; 将交叉口i中与同一行驶方向的车道数记为; 将上游交叉口中汇入的车流所对应的车道数记为; 将驶向的下游交叉口的出口车道数记为; 令表示交叉口i与的上游交叉口停车线之间的距离,单位为m; 令表示交叉口与的下游交叉口停车线之间的距离,单位为m; 步骤1.4、由公式2计算交叉口i与的上游交叉口间的异质相关性,记为; 2 式中,表示缩放因子; 步骤1.5、由公式3计算交叉口i与的下游交叉口间的异质相关性,记为; 3 所述步骤2中仿真平台搭建及初始化;具体过程为: 仿真平台选用SUMO软件; 在仿真开始时,将环境时间设为0,即令,,为仿真的最大持续时间; 步骤1采集的数据输入SUMO软件,在SUMO软件中配置为不同交通时段下的道路拓扑文件以及车辆路径分配文件;SUMO软件输出交叉口的交通状态、路网的交通状态、奖励函数; 所述将步骤1采集的数据输入SUMO软件,在SUMO软件中配置为不同交通时段下的道路拓扑文件;SUMO软件输出交叉口的交通状态、路网的交通状态、奖励函数;具体过程为: 步骤2.1、获取交叉口的交通状态;具体过程为: 步骤2.1.1、统计交叉口i在时刻方向进口车道的车辆数以及排队车辆数,单位为辆;; 由公式4、5计算交叉口i在时刻方向进口车道的交通密度与排队密度,单位为辆米; 将时刻交叉口i所有方向进口车道的交通密度与排队密度组成交叉口i在t时刻的进口车道交通状态,记为; 4 5 步骤2.1.2、统计交叉口i在时刻方向出口车道上的车辆数,单位为辆; 由公式6计算交叉口i在时刻方向出口车道的剩余空间指标; 令时刻交叉口i所有方向出口车道的剩余空间指标构成交叉口i在t时刻的出口道交通状态,记为; 6 式中,表示车道所能容纳的最大车辆数,单位为辆; 步骤2.1.3、将东西直行相位的编号设置为0,顺时针依次编号,统计交叉口在时刻显示绿灯的相位编号,记为; 令的集合表示交叉口i在t时刻的交通状态,记为; 步骤2.2、获取路网的交通状态;具体过程为: 步骤2.2.1、利用公式7计算交叉口i在t时刻的平均交通密度,单位为辆米; 利用公式8计算交叉口i在t时刻的平均排队密度,单位为辆米; 二者的集合构成路网环境下交叉口i在t时刻的平均进口道交通状态; 7 8 步骤2.2.2、采用公式9计算交叉口i在t时刻的平均剩余空间指标; 此时交叉口i在t时刻的平均出口道交通状态等同于; 9 步骤2.2.3、将的集合定义为交叉口i在t时刻的瞬时交通状态; 步骤2.2.4、统计从起始时刻开始时段内驶入路网的车辆数、驶出路网的车辆数,单位为辆; 令的集合表示t时刻整体路网的交通状态; 步骤2..3、获得奖励函数;具体过程为: 步骤2.3.1、由公式10计以t-1时刻为起始的时段内交叉口采取动作所能获得的奖励: 10 式中,表示在以t-1时刻为起始的时段内的车均延误,单位为s; 表示在以t-1时刻为起始的时段内的通行量,即驶离停车线的车辆数,单位为辆; 、分别是车均延误与通行量所对应的权重值,其中为负值,为正值; 步骤2.3.2、利用公式11计算全局奖励为各交叉口的奖励之和: 11。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉林大学,其通讯地址为:130023 吉林省长春市南关区人民大街5899号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励