中国科学院自动化研究所徐常胜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利基于多模态感知Mamba的无人机视觉语言导航方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119063736B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411248358.6,技术领域涉及:G01C21/20;该发明授权基于多模态感知Mamba的无人机视觉语言导航方法是由徐常胜;高君宇;王宗萌设计研发完成,并于2024-09-06向国家知识产权局提交的专利申请。
本基于多模态感知Mamba的无人机视觉语言导航方法在说明书摘要公布了:本发明公开了一种多模态感知Mamba的无人机视觉语言导航方法,包括:对文本指令信息建模,提取文本语义特征,使代理能够理解指令上下文内容;对无人机代理捕获的视觉图像以及位置方向进行建模,提取视觉语义和方向语义特征,使其能够感知环境信息;对导航的历史轨迹进行建模,提取历史轨迹特征,使无人机代理能够从历史信息中挖掘关键知识;基于Mamba模型将文本、视觉以及方向三个不同模态的信息融合学习,推理导航动作;将上述所有部分整合到一个统一的框架,进行模型的整体训练。本发明使得模型能够捕获不同模态关键的导航线索,促进多模态融合,提高导航效果。
本发明授权基于多模态感知Mamba的无人机视觉语言导航方法在权利要求书中公布了:1.一种基于多模态感知Mamba的无人机视觉语言导航方法,其特征在于,包括以下步骤: 步骤S1、对文本指令信息建模,提取文本关键语义特征,使无人机代理能够理解指令上下文内容; 步骤S2、对无人机代理捕获的视觉图像以及位置方向进行建模,提取视觉语义和方向语义特征,使其能够感知环境信息; 步骤S3、对导航的历史轨迹进行建模,提取历史轨迹特征,使无人机代理能够从历史信息中挖掘关键知识; 步骤S4、基于Mamba模型将文本、视觉以及方向三个不同模态的信息融合学习,推理导航动作,包括: 步骤S41:状态空间模型SSM通过一个隐藏状态将一维的函数或序列映射成输出,,变换过程如下: ; ; 其中,A,B,C,D是模型的参数,为了能够将上述过程应用到离散的信号中,采用零阶保持技术,使用步长参数将处理连续信号的参数A,B转换成处理离散信号的参数,,具体过程如下: ; ; ; 通过离散化处理后,处理离散信号的过程变为: ; ; 步骤S42:Mamba模型使用选择扫描算法,将参数B,C,建模为关于输入x的函数,动态的依赖与当前的输入,使模型能够理解序列中更重要的内容,而忽略无关的内容,包括: ; ; ; 其中,D为输入x的维度,R是一个低维度,N表示隐藏状态的维度;之后通过离散化操作获得对应的; 步骤S43:考虑到视觉语言导航的多模态特性,设计模态共享的参数化策略,将语言、视觉、方向特征映射到同一维度并拼接成一个序列X={;;},一方面使用原本构建策略,保持单模态的特征和稳定性;另一方面,设计按序模态融合机制构建低秩另外两个模态的特征,使模态间能够交互共享关键的导航信息,促进模型的选择机制,挖掘关键的导航线索,包括: =; ={;;}; ; ; ; 其中,序列长度扩展操作,保持不同模态融合时维度对齐; 步骤S44:通过步骤S43针对视觉语言导航任务优化Mamba模型后,通过改进的Mamba模型获得模态融合输出,然后通过全连接层预测对应的动作和关注区域,包括: ; ; ; 其中,是预测的3维位置坐标,表示预测的1维的进程完指标,判别进程完成程度,当大于一个阈值是导航停止;代表注意力掩码,用来判别当前无人机关注的区域;R是将预测掩码区域映射到原图尺寸,上述动态过程的损失函数如下: ; ; ,; 其中,表示均方误差损失,表示计算旋转角度变化,表示归一化扫描路径评分损失,,,表示从真实轨迹中获得标签; 步骤S5、将上述步骤整合到一个统一的框架,进行框架的整体训练,所述统一的框架的整合即优化损失函数L为: +。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励