中国科学院软件研究所薛云志获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院软件研究所申请的专利面向自动驾驶的关键场景生成方法、装置及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115757125B 。
龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211435590.1,技术领域涉及:G06F11/3668;该发明授权面向自动驾驶的关键场景生成方法、装置及计算机设备是由薛云志;康舒婷;郭恒;刘光镇;董乾;孟令中;陈贺;杨光设计研发完成,并于2022-11-16向国家知识产权局提交的专利申请。
本面向自动驾驶的关键场景生成方法、装置及计算机设备在说明书摘要公布了:本发明公开了一种面向自动驾驶的关键场景生成方法、装置及计算机设备,属于自动驾驶技术领域。所述方法包括:获取自动驾驶测试的测试任务对应的场景描述信息;从场景地图中获取符合场景描述信息的测试区域,并在测试区域中针对被测对象设置符合测试任务的行驶路线;从场景描述信息中提取场景参与者的原子动作;初始化强化学习模型对应的经验回放池,并基于场景描述信息、测试区域以及行驶路线,构建样本数据以存储至经验回放池;从经验回放池中抽取样本数据对强化学习模型进行更新,并通过更新后的强化学习模型获取原子动作的确定参数值;基于所有原子动作的确定参数值,生成用于实现测试任务的关键场景。本发明能够提升关键场景的生成效率。
本发明授权面向自动驾驶的关键场景生成方法、装置及计算机设备在权利要求书中公布了:1.一种面向自动驾驶的关键场景生成方法,其特征在于,所述方法包括: 获取自动驾驶测试的测试任务对应的场景描述信息,所述场景描述信息用于指示场景发生区域和场景参与者相关的信息; 从场景地图中获取符合所述场景描述信息的测试区域,并在所述测试区域中针对被测对象设置符合所述测试任务的行驶路线; 从所述场景描述信息中提取所述场景参与者的原子动作; 初始化强化学习模型对应的经验回放池,并基于所述场景描述信息、所述测试区域以及所述行驶路线,构建样本数据以存储至所述经验回放池;其中,所述强化学习模型包括:演员网络、演员网络对应的目标网络、第一评论员网络、第一评论员网络对应的目标网络、第二评论员网络、第二评论员网络对应的目标网络;所述演员网络,用于对输入的当前环境状态的参数值进行处理,输出当前原子动作的参数值;所述第一评论员网络和所述第二评论员网络,用于对输入的样本数据进行处理,分别输出相应原子动作对应的第一评价值和第二评价值;所述目标网络,用于稳定所述强化学习模型的期望收益; 从所述经验回放池中抽取样本数据对所述强化学习模型进行更新,并通过更新后的强化学习模型获取所述原子动作的确定参数值;其中,所述从所述经验回放池中抽取样本数据对所述强化学习模型进行更新,并通过更新后的强化学习模型获取所述原子动作的确定参数值,包括: 针对原子动作ai,从所述经验回放池中抽取目标数量的样本数据以用于所述强化学习模型的更新; 通过所述第一评论员网络和所述第二评论员网络,对每个样本数据中相应环境状态的训练参数值和相应原子动作的训练参数值进行处理,分别获取相应原子动作对应的第一评价值和第二评价值; 通过所述演员网络的目标网络,对每个样本数据中相应环境状态的下一个环境状态的训练参数值进行处理,获取相应原子动作的下一个原子动作的预测参数值; 通过所述第一评论员网络的目标网络和所述第二评论员网络的目标网络,对每个样本数据中相应环境状态的下一个环境状态的训练参数值,以及相应原子动作的下一个原子动作的预测参数值进行处理,分别获取相应原子动作的下一个原子动作对应的第一评价值和第二评价值; 基于所有样本数据中相应原子动作对应的奖励、相应原子动作对应的第一评价值,以及相应原子动作的下一个原子动作对应的第一评价值,构建所述第一评论员网络的损失函数;基于所有样本数据中相应原子动作对应的奖励、相应原子动作对应的第二评价值,以及相应原子动作的下一个原子动作对应的第二评价值,构建所述第二评论员网络的损失函数; 按照所述第一评论员网络的损失函数和所述第二评论员网络的损失函数分别进行反向梯度传播,更新所述第一评论员网络和所述第二评论员网络的参数; 基于所有样本数据中相应原子动作对应的第一评价值和第二评价值,构建所述演员网络的损失函数; 按照所述演员网络的损失函数进行反向梯度传播,更新所述演员网络的参数; 通过所述演员网络对环境状态si的确定参数值进行处理,获取所述原子动作ai的确定参数值;其中,所述环境状态si的确定参数值的获取过程包括:通过自动驾驶仿真测试平台按照所述测试区域和所述行驶路线,对环境状态si-1的确定参数值和原子动作ai-1的确定参数值进行处理,获取所述环境状态si的确定参数值;初始的环境状态s1的确定参数值基于所述场景描述信息得到,初始的原子动作a1的确定参数值通过所述演员网络对输入的环境状态s1的确定参数值处理得到; 基于所有原子动作的确定参数值,生成用于实现所述测试任务的关键场景,所述关键场景是指所述被测对象和所述场景参与者发生碰撞的概率最大的测试场景。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院软件研究所,其通讯地址为:100190 北京市海淀区中关村南四街4号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励