中国科学院自动化研究所王亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利精细化对齐学习的导航模型训练方法、导航方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120014488B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510043915.9,技术领域涉及:G06V20/17;该发明授权精细化对齐学习的导航模型训练方法、导航方法及装置是由王亮;黄岩;苏一飞;郭奕君设计研发完成,并于2025-01-10向国家知识产权局提交的专利申请。
本精细化对齐学习的导航模型训练方法、导航方法及装置在说明书摘要公布了:本发明提供一种精细化对齐学习的导航模型训练方法、导航方法及装置,该精细化对齐学习的导航模型训练方法包括:对从无人机航拍图像中提取的视觉特征、语义特征和空间特征进行加权融合,得到语义网格特征;基于多项辅助预测任务根据语义网格特征对实体与地标对象的精细化对齐关系进行显示学习,得到视觉表征;以精细化空中视觉对话导航数据集为训练样本,以视觉表征为输入特征,以综合损失为损失函数对导航模型进行迭代训练,得到空中视觉对话导航模型;其中,综合损失基于导航损失函数和多项辅助预测任务对应的损失函数确定。本发明方法通过全面融合多模态特征,提高了无人机在复杂场景中的导航精度、对齐能力和任务执行效率。
本发明授权精细化对齐学习的导航模型训练方法、导航方法及装置在权利要求书中公布了:1.一种精细化对齐学习的导航模型训练方法,其特征在于,包括: 从无人机航拍图像中提取出视觉特征、语义特征和空间特征,并对所述视觉特征、所述语义特征和所述空间特征进行加权融合,得到语义网格特征;其中,所述语义特征用于表示所述无人机航拍图像中的地标对象的类别信息和几何信息;所述空间特征用于表示无人机与所述地标对象之间的相对方向和相对距离; 基于多项辅助预测任务根据所述语义网格特征对实体与地标对象的精细化对齐关系进行显示学习,得到视觉表征;其中,所述多项辅助预测任务包括地标旋转边界框预测任务、地标语义预测任务和实体‑地标对比学习任务中的至少两项; 以精细化空中视觉对话导航数据集为训练样本,以所述视觉表征为输入特征,以综合损失为损失函数对导航模型进行迭代训练,得到空中视觉对话导航模型;其中,所述综合损失基于导航损失函数和所述多项辅助预测任务对应的损失函数确定;所述精细化空中视觉对话导航数据集是通过对无人机对话式导航AVDN数据集中实体‑地标数据进行细粒度扩充得到的;所述精细化空中视觉对话导航数据集通过如下步骤得到: 从AVDN数据集的导航对话数据中提取语言实体;所述语言实体包括多个地标对象、地标方位描述和语义关系; 从AVDN数据集中获取地标掩码,并提取所述地标掩码的旋转边界框信息,所述旋转边界框信息包括地标中心点、宽度、高度和旋转角度; 对所述语言实体和所述地标掩码进行初步对齐,并通过人工校验修正误匹配的实体‑地标对,得到所述精细化空中视觉对话导航数据; 所述基于多项辅助预测任务根据所述语义网格特征对实体与地标对象的精细化对齐关系进行显示学习,得到视觉表征包括: 通过所述地标旋转边界框预测任务根据多头交叉注意力机制和所述语义网格特征获取地标旋转边界框信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励