清华大学黄晋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学申请的专利车辆换道决策控制方法、装置、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120863640B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511397472.X,技术领域涉及:B60W30/18;该发明授权车辆换道决策控制方法、装置、设备和存储介质是由黄晋;苏炎召;张浩东;程坤;李惠乾;武晓宙设计研发完成,并于2025-09-28向国家知识产权局提交的专利申请。
本车辆换道决策控制方法、装置、设备和存储介质在说明书摘要公布了:本申请涉及一种车辆换道决策控制方法、装置、设备和存储介质。所述方法包括:获取目标车辆的当前状态信息,当前状态信息包括目标车辆的运动状态和目标车辆预设范围内其他车辆的运动状态;根据当前状态信息确定双经验回放缓冲区,双经验回放缓冲区用于存储多组规则经验和多组交互经验,规则经验根据当前状态信息和预设控制规则确定,交互经验根据当前状态信息和初始决策模型确定;根据双经验回放缓冲区和强化学习算法对初始决策模型进行训练,得到决策模型;根据当前状态信息和决策模型确定目标控制策略。采用本方法能够提高控制策略确定的效率和准确性。
本发明授权车辆换道决策控制方法、装置、设备和存储介质在权利要求书中公布了:1.一种车辆换道决策控制方法,其特征在于,所述方法包括: 获取目标车辆的当前状态信息,所述当前状态信息包括所述目标车辆的运动状态和所述目标车辆预设范围内其他车辆的运动状态; 根据所述当前状态信息确定双经验回放缓冲区,所述双经验回放缓冲区用于存储多组规则经验和多组交互经验,所述规则经验根据所述当前状态信息和预设控制规则确定,所述交互经验根据所述当前状态信息和初始决策模型确定; 在当前训练次数小于预设阈值的情况下,从所述多组规则经验中确定训练样本;所述规则经验和所述交互经验均包括状态信息、控制策略、奖励和下一时刻状态信息; 在所述训练次数不小于预设阈值的情况下,根据所述训练次数和预设总训练次数确定采样比例;所述采样比例包括第一采样比例和第二采样比例; 根据所述第一采样比例从所述多组规则经验中确定第一训练样本; 根据所述第二采样比例从目标交互经验集合中确定第二训练样本,所述目标交互经验集合中各所述交互经验的奖励均大于奖励阈值; 根据所述第一训练样本和所述第二训练样本确定训练样本; 根据所述训练样本和强化学习算法对所述初始决策模型进行训练,得到决策模型; 根据所述当前状态信息和所述决策模型确定目标控制策略; 所述根据所述当前状态信息确定双经验回放缓冲区,包括: 迭代执行多次经验生成流程,直至满足预设条件为止,根据多次迭代执行结果确定双经验回放缓冲区; 其中,第i次所述经验生成流程包括: 根据状态信息和所述预设控制规则确定第一控制策略,在虚拟环境中执行所述第一控制策略,并确定第一奖励和所述目标车辆的第一下一时刻状态信息;其中,在i等于1时,所述状态信息为所述当前状态信息,在i大于1时,所述状态信息为第i-1次所述经验生成流程中确定的所述第一下一时刻状态信息; 根据所述状态信息和所述初始决策模型确定第二控制策略,在虚拟环境中执行所述第二控制策略,并确定第二奖励和所述目标车辆的第二下一时刻状态信息;其中,在i等于1时,所述状态信息为所述当前状态信息,在i大于1时,所述状态信息为第i-1次所述经验生成流程中确定的所述第二下一时刻状态信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区清华园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励