吉林大学赵睿获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉吉林大学申请的专利一种基于投影式约束策略优化的自动道路交叉口管理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116935671B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311055163.5,技术领域涉及:G08G1/081;该发明授权一种基于投影式约束策略优化的自动道路交叉口管理方法是由赵睿;王骙;高菲;李云;高镇海;张天瑶设计研发完成,并于2023-08-22向国家知识产权局提交的专利申请。
本一种基于投影式约束策略优化的自动道路交叉口管理方法在说明书摘要公布了:本发明适用于智能交通系统技术领域,提供了一种基于投影式约束策略优化的自动道路交叉口管理方法,引入风险网络,在更新策略时划分安全等级,在满足安全性的前提下最大化奖励值,解决了强化学习算法在追求通行效率与舒适性会违背安全性的问题。除此之外,策略神经网络应用LSTM神经网络捕获每辆车之间的关系并且集中调控复杂路口中的全部车辆以获得性能更加优良的策略。通过实验测试,并将与基于非风险感知的PPO和PPO‑SC、基于MPC的车辆交叉口协调方案算法以及基于MIP的MICA算法的性能进行对比,实验表明本方法具有更加优秀的表现。
本发明授权一种基于投影式约束策略优化的自动道路交叉口管理方法在权利要求书中公布了:1.一种基于投影式约束策略优化的自动道路交叉口管理方法,其特征在于,包括以下步骤: 步骤1、投影式约束策略优化: 包含六个要素:策略网络、模型、奖励函数、风险函数、价值估计网络和风险估计网络;策略网络使用LSTM神经网络,用于根据智能体的当前的状态决定智能体下一步的行为;模型用于为智能体与环境的交互提供场景;奖励函数用于引导智能体学习,使智能体达到预期目标;价值估计网络用于对智能体当前的策略做出评价以更新策略网络;风险函数用于保证智能体探索过程的安全;风险估计网络用于评估智能体当前行为的危险程度以限制策略网络的更新; 策略网络在更新时,首先会判断当前策略的安全风险,安全风险划分为三个等级:安全、相对安全以及危险;若当前策略处于安全范围,则策略更新时不考虑风险函数,策略将会朝奖励最大化的方向更新;若当前策略处于相对安全范围,此时策略网络先进行奖励最大化更新,之后将策略在风险约束集上进行投影,使策略重新回到安全范围内;若当前策略处于危险范围,则通过回溯寻找适合网络更新的参数; 步骤2、基于投影式约束策略优化的自动交叉口管理: 搭建一个复杂路口场景作为模型,设计奖励函数与风险函数,奖励函数兼顾车辆的通行效率、舒适性、碰撞安全性以及横向控制稳定性,风险函数兼顾车辆的碰撞风险以及车辆间距小于安全车距的风险; 策略训练过程为:在预定时间内让车辆探索行为,策略网络通过输入车辆距离目标地点的距离以及车辆当前的速度控制环境中所有车辆的速度,车辆行驶的路线由仿真器设计,如果发生碰撞或者车辆全部通过则重置场景,搜集这段时间内策略网络的输入、策略网络的输出、得分、风险值、价值估计值以及风险估计值,用以更新策略网络、价值估计网络和风险估计网络; 所述步骤2包括以下具体步骤: 步骤2.1、状态空间与行为空间的设计: 定义状态空间为,代表进入复杂路口区域的智能驾驶汽车距离离去点的距离,代表智能驾驶汽车的行驶方向,分别表示智能驾驶汽车右转、直行与左转行为; 的计算分两种情况:车辆从直道驶入以及车辆从弯道驶入;当车辆从直道驶入时,分为右转、直行与左转三种行为,三种行为的计算公式为: 11; 当车辆从弯道驶入时,同样分为右转、直行与左转三种行为,计算公式为: 12; 代表智能驾驶汽车在当前时间步下的实时速度,每辆车经过复杂路口时只有一种行驶方向,将剩余两个行驶方向的状态空间用零向量填充;赋予策略智能驾驶汽车的转向信息,结合策略判断智能驾驶汽车当前处于复杂路口的位置,同时状态空间包括每个智能驾驶汽车当前的速度信息; 行为空间定义为,模型的联合行为空间只选择复杂路口区域全部智能驾驶汽车未来的联合期望速度; 步骤2.2、定义风险函数与奖励函数: 首先定义风险函数,智能驾驶汽车在通过复杂路口时潜在的安全风险包括碰撞与侧滑: 碰撞: 13; 其中代表发生碰撞时赋予的风险值;,代表在时间步下存在碰撞风险的智能驾驶汽车违背安全车距时赋予的风险值,代表存在碰撞风险且违背安全距离的智能驾驶汽车的对数; 侧滑: 14; 其中, 代表智能驾驶汽车在时间步下的瞬时加速度,代表重力加速度,代表复杂路口路面的摩擦系数;则风险函数定义为:、 15; 接着定义奖励函数,安全性:智能驾驶汽车安全性的奖励分为引导性奖励与决定性奖励: 16; 其中代表引导性奖励,代表决定性奖励; 高效性: 17; 其中为折扣因子,代表在时间步下智能驾驶汽车的车速与期望车速的差值,代表时间积累造成的奖励损失; 平顺性: 18; 其中,代表一个时间步智能驾驶汽车的加速度;综上,奖励函数定义为: 19。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉林大学,其通讯地址为:130000 吉林省长春市前进大街2699号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励