合肥讯图信息科技有限公司魏文韬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥讯图信息科技有限公司申请的专利一种基于深度强化学习的交通信号灯感应控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120279738B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510493049.3,技术领域涉及:G08G1/081;该发明授权一种基于深度强化学习的交通信号灯感应控制方法及系统是由魏文韬;刘王伟;宁烁;王辰昊;陈海涛;沈董军;钱生印;曹诗敏设计研发完成,并于2025-04-18向国家知识产权局提交的专利申请。
本一种基于深度强化学习的交通信号灯感应控制方法及系统在说明书摘要公布了:本发明实施例提供一种基于深度强化学习的交通信号灯感应控制方法及系统,属于交通物联网控制技术领域。所述交通信号灯感应控制方法包括:将交叉口的交通信号灯控制问题建模为马尔可夫决策过程,并定义观察空间、动作空间以及奖励函数;获取所述交通信号灯的离散时序轨迹数据;本发明提供的一种基于深度强化学习的交通信号灯感应控制方法及系统通过基于近端策略优化的transformer网络模型能够有效防止训练过程中策略突变导致的震荡,减少先验知识的依赖,同时能够动态聚焦关键车道信息,可迁移至不同路口拓扑,进而有效地提高了交通信号灯控制的效果以及通用性。
本发明授权一种基于深度强化学习的交通信号灯感应控制方法及系统在权利要求书中公布了:1.一种基于深度强化学习的交通信号灯感应控制方法,其特征在于,包括: 将交叉口的交通信号灯控制问题建模为马尔可夫决策过程,并定义观察空间、动作空间以及奖励函数,其中,所述奖励函数包括: 根据公式1获取奖励函数, 1 其中,为奖励函数,为第个相位效率因子,为第个基础奖励项,为整数编号,且,为绿波权重,为绿波协调奖励项,为紧急权重,为紧急车辆优先项,为排放权重,为碳排放惩罚项; 获取所述交通信号灯的离散时序轨迹数据; 根据所述离散时序轨迹数据构建并训练基于近端策略优化的transformer网络模型; 根据基于近端策略优化的transformer网络模型获取当前所述交通信号灯的最优动作策略并执行; 定义观察空间、动作空间以及奖励函数包括: 根据公式2定义所述观察空间: 2 其中,为所述观察空间,为所述交叉口的车道总数量,为车道的观测数据,为车道的车辆数,为车道的低速车辆平均等待时间,为车道的排队长度,为车道的车辆平均速度,为紧急车辆在车道的等待时间,为相邻路口相位差,为车道中车辆的启停次数,为整数编号; 根据公式3定义所述动作空间: 3 其中,为所述动作空间,为第个离散交通信号相位,为交通信号相位总数; 根据所述离散时序轨迹数据构建并训练基于近端策略优化的transformer网络模型包括: 将所述离散时序轨迹数据进行向量化,并输入至基于近端策略优化的transformer网络模型中; 获取查询向量、键向量以及值向量; 根据公式8获取注意力函数, 8 其中,为注意力函数,为softmax函数,为查询向量,为键向量,为值向量,为向量的维度; 获取编码后输出并输入至多层感知机中,以获取编码观测; 将所述编码观测输入至下一个多层感知机中,以获取价值估计值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥讯图信息科技有限公司,其通讯地址为:230088 安徽省合肥市高新区创新产业园二期J1楼C座9层901室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励