东南大学彭剑坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种个性化的自动变道和速度控制驾驶协同决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119568156B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411790405.X,技术领域涉及:B60W30/18;该发明授权一种个性化的自动变道和速度控制驾驶协同决策方法是由彭剑坤;余思辰;王振阳;皮大伟;韩雨;张思雨;范毅设计研发完成,并于2024-12-06向国家知识产权局提交的专利申请。
本一种个性化的自动变道和速度控制驾驶协同决策方法在说明书摘要公布了:本发明涉及一种个性化的自动变道和速度控制驾驶协同决策方法,包括:步骤S1:构建个性化决策分层框架;步骤S2:搭建换道决策训练网络,确定换道决策的优化目标,同时引入动作屏蔽机制消除危险动作的安全隐患,设定训练所需的上层状态空间、动作空间和换道奖励函数,并赋予换道奖励函数个性化权重;步骤S3:搭建跟驰决策训练网络,确定跟驰决策的优化目标,同时将优化目标定量化为奖励系数,并设定训练所需的下层状态空间、动作空间和跟驰奖励函数,并赋予跟驰奖励函数个性化权重;步骤S4:采用协同决策方法并进行换道决策训练网络和跟驰决策训练网络的耦合训练,并搭建风格奖励优先体验回放来丰富经验回放优先级度量。与现有技术相比,本发明具有提高车辆的安全性和行驶效率等优点。
本发明授权一种个性化的自动变道和速度控制驾驶协同决策方法在权利要求书中公布了:1.一种个性化的自动变道和速度控制驾驶协同决策方法,其特征在于,包括: 步骤S1:构建个性化决策分层框架,其中,所述个性化决策分层框架基于决策结果仿真得到特征参数,以提供共享状态空间; 步骤S2:搭建换道决策训练网络,确定换道决策的优化目标,同时引入动作屏蔽机制消除危险动作的安全隐患,设定训练所需的上层状态空间、上层动作空间和换道奖励函数,并赋予换道奖励函数个性化权重,其中,所述上层状态空间基于所述共享状态空间确定; 步骤S3:搭建跟驰决策训练网络,确定跟驰决策的优化目标,同时将优化目标定量化为奖励系数,并设定训练所需的下层状态空间、下层动作空间和跟驰奖励函数,并赋予跟驰奖励函数个性化权重,其中,所述下层状态空间基于所述共享状态空间确定; 步骤S4:采用协同决策方法并进行换道决策训练网络和跟驰决策训练网络的耦合训练,并搭建风格奖励优先体验回放来丰富经验回放优先级度量; 所述风格奖励优先体验回放将体验优先级计算分为TD误差指标和激励指标,其中激励指标由R_Advantage和Q_Advantage组成,用于评估不同驾驶风格对于不同奖励和速度探索偏好,提高算法的收敛性,基于不同风格下的奖励期望和目标偏好,赋予样本优先级个性化的权重系数,对于不同转移,其样本优先级定义为: 其中:为TD误差指标的权重,为TD误差指标,为激励指标,为微量常数,为平均TD误差,、为常数,rt为短期奖励,为长期奖励; 所述平均TD误差为: 其中:为根据从环境获得的奖励计算出的TD目标值,为跟驰决策训练网络中Critic网络j估计的Action-value函数值Q。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210018 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励