北京奇虎科技有限公司谢春宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京奇虎科技有限公司申请的专利图文匹配方法、装置、设备、存储介质及计算机程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120997624B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511509696.5,技术领域涉及:G06V10/776;该发明授权图文匹配方法、装置、设备、存储介质及计算机程序产品是由谢春宇;王斌;孔凡静;李金城;冷大炜;殷宇辉设计研发完成,并于2025-10-22向国家知识产权局提交的专利申请。
本图文匹配方法、装置、设备、存储介质及计算机程序产品在说明书摘要公布了:本申请涉及计算机技术领域,公开了一种图文匹配方法、装置、设备、存储介质及计算机程序产品,该方法包括:响应于输入的查询文本,将查询文本输入预设图文匹配模型,通过预设图文匹配模型分别提取候选图像的图像特征和查询文本的文本特征,预设图文匹配模型为基于文本模内对比损失进行细粒度对齐训练获得的模型,基于文本模内对比损失的细粒度对齐训练用于增强模型对语义相似文本的区分能力,基于图像特征和文本特征确定与查询文本匹配的目标图像;由于本申请预先基于文本模内对比损失对图文匹配模型进行细粒度对齐训练,以增强模型对语义相似文本的区分能力,从而能够提升图文匹配过程中细粒度匹配的精度,进而能够提高图文匹配的准确性。
本发明授权图文匹配方法、装置、设备、存储介质及计算机程序产品在权利要求书中公布了:1.一种图文匹配方法,其特征在于,所述图文匹配方法包括: 响应于输入的查询文本,将所述查询文本输入预设图文匹配模型; 通过所述预设图文匹配模型分别提取候选图像的图像特征和所述查询文本的文本特征,其中,所述预设图文匹配模型为基于文本模内对比损失进行细粒度对齐训练获得的模型,基于文本模内对比损失的细粒度对齐训练用于增强模型对语义相似文本的区分能力; 基于所述图像特征和所述文本特征确定与所述查询文本匹配的目标图像; 其中,将所述查询文本输入预设图文匹配模型之前,还包括: 构建目标数据集,其中,所述目标数据集包括短文本描述、长文本描述以及对应的样本图像; 基于所述目标数据集对初始图文匹配模型进行全局对齐训练,获得全局对齐后模型; 基于所述目标数据集和细粒度学习目标对所述全局对齐后模型进行细粒度对齐训练,获得目标学习后模型,其中,所述细粒度学习目标包括区域级对齐目标、判别性学习目标以及跨模态排序目标中的至少一项; 从所述目标数据集中筛选语义相似度高的文本对,并将所述文本对分为正文本对和负文本对,所述正文本对是指语义相似度高的文本对中,核心语义完全一致且细粒度差异极小的文本组合,所述负文本对是指语义相似度高的文本对中,核心语义相近但存在关键细粒度差异的文本组合; 将所述正文本对和所述负文本对输入所述目标学习后模型,并通过所述目标学习后模型将每段文本转化为固定维度的特征向量,所有特征向量共同构成文本编码空间; 在所述文本编码空间内,针对每一组正负文本对分别计算特征距离; 基于所述特征距离构建文本模内对比损失,以拉近正文本对距离、推远负文本对距离为优化目标,基于所述文本模内对比损失对所述目标学习后模型进行细粒度对齐训练,获得预设图文匹配模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京奇虎科技有限公司,其通讯地址为:100015 北京市朝阳区酒仙桥路6号院2号楼1至19层104号内8层801;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励