哈尔滨工业大学叶超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于预训练视觉模型的时序对比视觉伺服方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121535758B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610063019.3,技术领域涉及:B25J9/16;该发明授权一种基于预训练视觉模型的时序对比视觉伺服方法是由叶超;刘洋;林伟阳设计研发完成,并于2026-01-19向国家知识产权局提交的专利申请。
本一种基于预训练视觉模型的时序对比视觉伺服方法在说明书摘要公布了:本发明提出了一种基于预训练视觉模型的时序对比视觉伺服方法,涉及视觉伺服技术领域,获取当前时刻的当前图像和期望的目标图像,并从图像缓存区中获取历史时刻的图像序列;将当前图像、目标图像和历史图像序列输入预训练的视觉基础模型进行特征编码,得到对应的图像编码向量;使用多个连续的自注意力层对图像编码向量进行时序对比计算,以捕捉图像序列中的动态关联信息;对经过时序对比计算的图像编码向量进行注意力聚合,得到聚合后的编码向量;基于聚合后的编码向量,预测当前时刻相机的6轴速度,包括方向向量和模长,并通过归一化方向向量与模长相乘合成最终速度命令,用于控制相机或机器人完成视觉伺服任务。
本发明授权一种基于预训练视觉模型的时序对比视觉伺服方法在权利要求书中公布了:1.一种基于预训练视觉模型的时序对比视觉伺服方法,其特征在于,包括以下步骤: S1、获取当前时刻的当前图像和期望的目标图像,并从图像缓存区中获取历史图像序列,其中所述图像缓存区存储了过去H个时刻的历史图像; S2、将所述当前图像、目标图像和历史图像序列并行化输入预训练的视觉基础模型进行特征编码,得到对应的图像编码向量; S3、将所述当前图像、目标图像、历史图像序列对应的图像编码向量拼接为时序特征序列,输入多层连续自注意力层构成的时序对比网络进行计算,对时序特征序列中任意时刻的编码向量,基于查询向量、键向量和值向量进行注意力计算,通过自注意力机制与其他所有时刻的编码向量进行跨时刻对比,捕捉不同时刻图像特征之间的依赖关系; 针对任意一伺服过程,每时刻获得当前图像和目标图像,在时刻,长度为H的缓存区能缓存张历史观察图像,将当前图像、目标图像和历史观察图像构成图像集输入预训练的视觉基础模型进行编码,得到时刻对应图像的输出编码: ; 对各个时刻的图像编码输出进行拼接以引入时序建模; 将编码序列输入由多个连续自注意力层构成的时序对比网络,通过查询-键-值注意力机制,计算不同时刻图像以及与目标图像特征间的对比依赖关系,实现基于时序的特征对比模式; 对各图像输出编码使用个连续的自注意力层进行对比计算,针对中第i个部分,使用线性层投影Linear计算出查询向量Q、键向量K和值向量V: ; 结合softmax计算对第i个部分计算得出的Qi、Ki、Vi向量求取自注意力计算结果: ; 其中,代表编码向量的维度; S4、对经过时刻对比计算得到的编码向量进行注意力聚合,得到聚合后的编码向量; S5、基于所述聚合后的编码向量,预测当前时刻相机的6轴速度,实现基于时序对比网络设计的大规模视觉模型先验转化迁移,形成图像输入到控制输出的端到端控制,控制相机或机器人完成视觉伺服任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励