北京航空航天大学任毅龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学申请的专利一种基于安全意识聚集的强化学习交通信号控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119380547B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411581849.2,技术领域涉及:G08G1/01;该发明授权一种基于安全意识聚集的强化学习交通信号控制方法是由任毅龙;付翔;于海洋;姜涵设计研发完成,并于2024-11-07向国家知识产权局提交的专利申请。
本一种基于安全意识聚集的强化学习交通信号控制方法在说明书摘要公布了:本发明公开了一种基于安全意识聚集的强化学习交通信号控制方法,包括:构建模型;训练所述模型,包括:步骤一:获取历史状态信息;步骤二:更新第一模块,所述第一模块包括状态编码器、动作‑状态编码器、溢流编码器和等待编码器;步骤三:更新第二模块,所述第二模块包括行动者网络、奖励批评者网络、溢流代价批评者网络和等待时间批评者网络;步骤四:重复步骤一至步骤三,直至超过预设次数,得到训练后的模型;获取当前时刻的观测信息,将当前时刻的观测信息输入至训练后的行动者网络中,得到当前动作以控制交通信号。本发明将安全性融入到环境交互、状态表征以及策略学习三方面,提高交通的安全性。
本发明授权一种基于安全意识聚集的强化学习交通信号控制方法在权利要求书中公布了:1.一种基于安全意识聚集的强化学习交通信号控制方法,其特征在于,包括: 构建模型,所述模型包括第一模块和第二模块; 训练所述模型,包括: 步骤一:获取历史状态信息,所述历史状态信息包括第一观测信息、第二观测信息、动作、奖励值、溢流代价值和等待代价值,所述第一观测信息和第二观测信息对应的时刻为相邻的先后时刻; 步骤二:更新第一模块,所述第一模块包括状态编码器、动作-状态编码器、溢流编码器和等待编码器,包括:利用状态编码器分别对第一观测信息和第二观测信息处理得到第一特征和第二特征,并对第一特征和第二特征分别进行归一化得到第三特征和第四特征;利用动作-状态编码器对动作与第三特征处理得到第五特征;利用溢流编码器分别对第三特征和第四特征进行编码,分别得到第一溢流预测评分和第二溢流预测评分;利用等待编码器分别对第三特征和第四特征进行编码,分别得到第一等待预测评分和第二等待预测评分;基于第二特征、第五特征、溢流代价值、第一溢流预测评分、第二溢流预测评分、等待代价值、第一等待预测评分和第二等待预测评分构建第一目标函数,并最小化第一目标函数以更新各编码器; 步骤三:更新第二模块,所述第二模块包括行动者网络、奖励批评者网络、溢流代价批评者网络和等待时间批评者网络,包括:将第一观测信息和第一特征输入至行动者网络中,得到第一概率值;将第一特征和第二特征分别输入至奖励批评者网络、溢流代价批评者网络和等待时间批评者网络中,得到对应的奖励价值、溢流代价价值和等待代价价值,所述奖励价值包括与第一特征对应的第一奖励价值,所述溢流代价价值包括与第一特征对应的第一溢流代价价值,所述等待代价价值包括与第一特征对应的第一等待代价价值;将奖励值和奖励价值输入至奖励优势评估函数中得到奖励优势评估值;将溢流代价值和溢流代价价值输入至溢流代价优势评估函数中得到溢流代价评估值;将等待代价值和等待代价价值输入至等待代价优势评估函数中,得到等待代价评估值;基于奖励优势评估值、溢流代价评估值、等待代价评估值和第一概率值优化行动者网络;基于奖励值和第一奖励价值优化奖励批评者网络;基于溢流代价值和第一溢流代价价值优化溢流代价批评者网络;基于等待代价值和第一等待代价价值优化等待时间批评者网络; 步骤四:重复步骤一至步骤三,直至超过预设次数,得到训练后的模型; 获取当前时刻的观测信息,将当前时刻的观测信息输入至训练后的行动者网络中,得到当前动作以控制交通信号; 观测信息包括排队长度、平均交通流量、最大占有率、当前方向是否为直行方向、当前移动方向是否为绿灯和当前移动方向是否达到最小绿灯时间; 所述奖励值由奖励函数计算得到,所述奖励函数基于排队长队、等待时间、等待容忍时间和等待车辆数构建,所述溢流代价值由基于预设值构建的溢流代价函数计算得到,所述等待代价值由基于等待时间和等待容忍时间构建的等待时间代价函数计算得到。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100083 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励