浙江大学李恒涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于大规模预训练模型视觉特征的语义匹配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119478455B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411348904.3,技术领域涉及:G06V10/75;该发明授权一种基于大规模预训练模型视觉特征的语义匹配方法是由李恒涛;刘阳;朱慕之;毛伟岸;陈昊;沈春华设计研发完成,并于2024-09-26向国家知识产权局提交的专利申请。
本一种基于大规模预训练模型视觉特征的语义匹配方法在说明书摘要公布了:本发明公开了一种基于大规模预训练模型视觉特征的语义匹配方法,包括以下步骤:获取图像数据集,其包括目标图像和对应语义的参考图像;基于视觉基础模型框架构建对应的语义匹配网络,所述语义匹配网络包括特征提取模块,交错感知模块,匹配模块以及上采样模块;利用图像数据集对语义匹配网络进行训练,以获得用于图像语义匹配的语义匹配模型;将参考图像和参考图像上待匹配的点,以及目标图像输入至语义匹配模型,以输出目标图像上相匹配的点。本发明提供的方法能有效提高语义匹配任务的准确度,为下游视觉任务提供更好的服务。
本发明授权一种基于大规模预训练模型视觉特征的语义匹配方法在权利要求书中公布了:1.一种基于大规模预训练模型视觉特征的语义匹配方法,其特征在于,包括以下步骤: 获取图像数据集,其包括目标图像和对应语义的参考图像; 基于视觉基础模型框架构建对应的语义匹配网络,所述语义匹配网络包括特征提取模块,交错感知模块,匹配模块以及上采样模块; 所述特征提取模块包括普通图像编码器和高分辨率图像编码器,所述普通图像编码器用于对输入的目标图像和参考图像进行特征提取,以获得对应的目标图像特征和参考图像特征,所述高分辨率图像编码器用于对输入的目标图像和参考图像进行高分辨特征提取,以获得对应的高分辨率参考图像特征和高分辨率目标图像特征; 所述交错感知模块,用于对目标图像特征和参考图像特征进行图像增强,以输出对应的增强参考图像特征和增强目标图像特征; 所述交错感知模块包括两个注意力块,每个注意力块沿图像特征输入方向依次设有交叉注意力层、自注意力层和前馈网络; 所述匹配模块,用于计算增强参考图像特征和增强目标图像特征之间语义相似度,以构建对应的语义相似度矩阵,并基于所述语义相似度矩阵计算对应的初始匹配流,以及计算高分辨率参考图像特征和高分辨率目标图像特征之间特征的相似度,以构建对应的高分辨率纹理相似度矩阵; 所述上采样模块,利用初始匹配流对所构建的高分辨率纹理相似度矩阵进行裁剪,以输出局部纹理相似度矩阵,将所述局部纹理相似度矩阵与初始匹配流进行拼接以及上采样,并将上采样的结果进行卷积回归操作,以输出目标图像的预测匹配结果; 利用图像数据集对语义匹配网络进行训练,以获得用于图像语义匹配的语义匹配模型; 将参考图像和参考图像上待匹配的点,以及目标图像输入至语义匹配模型,以输出目标图像上相匹配的点。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励