河海大学付云鹤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉河海大学申请的专利一种具有主动对话能力的无人机空中导航视觉语言动作控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121521133B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610051755.7,技术领域涉及:G01C21/20;该发明授权一种具有主动对话能力的无人机空中导航视觉语言动作控制方法是由付云鹤;黄泓亮;陈进宇;王渌汀;沈德建;刘偲设计研发完成,并于2026-01-15向国家知识产权局提交的专利申请。
本一种具有主动对话能力的无人机空中导航视觉语言动作控制方法在说明书摘要公布了:本发明提出一种具有主动对话能力的无人机空中导航视觉语言动作控制方法,属于无人机导航技术领域。通过LLM处理对话历史数据、视觉编码器提取图像特征,结合观测历史数据获取空间与时序特征,引入PNaQ模块实现位移更新、终止判断与主动提问,搭配一次性数据增强技术扩增数据集,解决长程导航时空关系混乱、缺乏主动提问等问题,提升导航准确性与交互性。
本发明授权一种具有主动对话能力的无人机空中导航视觉语言动作控制方法在权利要求书中公布了:1.一种具有主动对话能力的无人机空中导航视觉语言动作控制方法,其特征在于,包括以下步骤: S1:将无人机对话历史数据,经大语言模型LLM的嵌入层,得到当前时刻的对话历史编码向量text,t;将无人机的当前帧图像,通过视觉编码器提取特征,得到当前帧图像的图像特征,并展平并线性投影到LLM空间,得到当前时刻的视觉编码向量vis,t S2:基于无人机的观测历史数据,采用正射重投影将观测历史数据投影到地面后再拼接,得到当前时刻的拼接图像;对当前时刻的拼接图像通过取最小外接矩形,并对无效区域进行填充0操作,得到当前时刻的统一尺寸的地图;对当前时刻的统一尺寸的地图,先进行视觉特征提取,再通过展平和编码操作,得到当前时刻的空间特征;式中,表示第帧的图像;表示第帧图像中相机的位姿; S3:首先基于当前时刻的历史图像特征序列1:t-1,获得其在时间维度上的特征序列;然后,基于统一尺寸的地图,提取当前时刻的全局地图编码特征;随后采用多粒度注意力机制,通过与链接,并最终得到历史探索的时序特征; S4:引入进度驱动的导航-询问选择模块PNaQ,PNaQ引入了两个特殊的词元[act]和[que],[act]用于动作预测,[que]用于语言生成;[act]后附加四个可学习词元:,结合Etext,t、Evis,t、、组成输入序列Dt;将输入序列Dt输入到LLM中,输出共同管理无人机的行为,利用更新无人机的水平和垂直位移矢量;利用预测无人机的终止概率,根据设定的阈值,判断无人机是否停止导航;利用评估导航进度,基于设定的规则,判断是否发出提问,当发出提问时,外部应答模块返回回答,并将回答更新S1中的对话历史数据; S5:基于一次性数据增强,将LLM预测产生的新的“对话-动作-轨迹三元组”纳入增广数据集中,并在每轮训练中以设定的比例采样。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河海大学,其通讯地址为:211100 江苏省南京市江宁区佛城西路8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励