天津大学刘若楠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津大学申请的专利一种基于follower模型的视觉语言导航方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115824213B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211447071.7,技术领域涉及:G01C21/20;该发明授权一种基于follower模型的视觉语言导航方法是由刘若楠;李泽康设计研发完成,并于2022-11-18向国家知识产权局提交的专利申请。
本一种基于follower模型的视觉语言导航方法在说明书摘要公布了:本发明公开一种基于follower模型的视觉语言导航方法,follower模型由编码器和解码器组成,编码器和解码器均采用长短期记忆网络结构,编码器用于对视觉图像特征进行预处理,编码器用于预测下一时间步动作;还包括跨模态对比学习模块和视觉变分自编码器模块,follower模型、跨模态对比学习模块和视觉变分自编码器模块共同组成智能体导航模型,所述跨模态对比学习模块用于学习语言和视觉两种跨模态信息;所述视觉变分自编码器模块包括视觉编码器和视觉解码器,用于学习视觉图像特征的分布;智能体导航模型的损失函数由Loss1、Loss2和Loss3组成,Loss1是视觉变分自编码器模块的损失函数,Loss2是follower模型的损失函数,Loss3是跨模态对比学习模块的损失函数。
本发明授权一种基于follower模型的视觉语言导航方法在权利要求书中公布了:1.一种基于follower模型的视觉语言导航方法,follower模型由编码器和解码器组成,编码器和解码器均采用长短期记忆网络结构,编码器用于对视觉图像特征进行预处理,解码器用于预测下一时间步动作;其特征在于,还包括跨模态对比学习模块和视觉变分自编码器模块,follower模型、跨模态对比学习模块和视觉变分自编码器模块共同组成智能体导航模型,所述跨模态对比学习模块用于学习语言和视觉两种跨模态信息;所述视觉变分自编码器模块包括视觉编码器和视觉解码器,用于学习视觉图像特征的分布; 智能体导航模型的损失函数由、和组成,是视觉变分自编码器模块的损失函数,包括视觉特征重建损失和衡量分布相似性的KL散度;是follower模型的损失函数,并增设有一个随时间递增的超参数,用以约束智能体导航模型,避免智能体导航模型的导航误差随时间累积过大,是跨模态对比学习模块的损失函数,采用对比学习损失函数,所述跨模态对比学习模块能够拉近相似跨模态信息在隐空间中的距离,拉远不相似跨模态信息在隐空间中的距离,使智能体导航模型能有效地编码语言信息和视觉信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300350 天津市津南区海河教育园雅观路135号天津大学北洋园校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。