江苏省海量数据技术研究所有限公司卢山获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏省海量数据技术研究所有限公司申请的专利一种基于多模态的特定图片识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117218360B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311052834.2,技术领域涉及:G06V10/40;该发明授权一种基于多模态的特定图片识别方法是由卢山;潘通;郑鹏;董文君;汤国强;周天河;于文年设计研发完成,并于2023-08-21向国家知识产权局提交的专利申请。
本一种基于多模态的特定图片识别方法在说明书摘要公布了:本发明公开了一种基于多模态的特定图片识别方法,涉及某特定图片识别领域,包含FH‑LANet对图片、文本的特征信息提取和特定图片匹配策略两部分,通过多模态特征提取网络FH‑LANet模型对图片提取特征采用图像匹配的思路,选取特定图片作为查询库图片,查询特征不是单一模态的图片特征,而是融合了文本特征,使用输入图片的特征和查询特征进行相似度计算,然后进行阈值判断,匹配上的和过滤图片、过滤文本再进行匹配,过滤掉噪声数据,与查询图片没有匹配上的与查询文本进行二次匹配,最终获得图片的识别结果,其能够准确找出海量图片中的某特定图片。
本发明授权一种基于多模态的特定图片识别方法在权利要求书中公布了:1.一种基于多模态的特定图片识别方法,其特征在于:包含两个部分: 一、对图片、文本的特征信息提取; 二、特定图片匹配策略; 具体包含如下步骤: 步骤1,通过多模态特征提取网络FH-LANet模型对图片提取特征;其中,多模态特征提取网络FH-LANet模型包含图像编码器和文本编码器两部分,具体如下: 步骤1.1,收集图片和文本配对的图文对,文本是对图像内容的描述; 步骤1.2,通过图像分块、文本的词向量化,把图片、文本转化为序列化; 步骤1.3,选择图像编码器、文本编码器对图像、文本进行前向传播提取特征,并利用对比学习损失函数进行反向传播,训练多模态图文模型; 步骤2,使用输入图片的特征和查询特征进行余弦相似度计算,然后进行阈值判断,匹配上的和过滤图片、过滤文本再进行匹配,过滤掉噪声数据,与查询图片没有匹配上的与查询文本进行二次匹配,获得图片的识别结果,其中,余弦相似度具体计算方式如下: 其中A、B表示为两个N维的向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏省海量数据技术研究所有限公司,其通讯地址为:210019 江苏省南京市建邺区云龙山路88号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励