中国科学院计算技术研究所陈薇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院计算技术研究所申请的专利基于多模态模型CLIP的隐空间净化的图像分类方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119418123B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411558624.5,技术领域涉及:G06V10/764;该发明授权基于多模态模型CLIP的隐空间净化的图像分类方法及装置是由陈薇;毕可平;张明坤;郭嘉丰;程学旗设计研发完成,并于2024-11-04向国家知识产权局提交的专利申请。
本基于多模态模型CLIP的隐空间净化的图像分类方法及装置在说明书摘要公布了:本发明提出一种基于多模态模型CLIP的隐空间净化的图像分类方法和装置,包括:将待分类图片输入图文多模态对比预训练模型的图像编码器,得到待分类图片在隐空间上的表示向量;使用图文多模态对比预训练模型的文本编码器,得到空类别文本所表示的空类别文本嵌入向量;计算表示向量和空类别文本嵌入向量的概率似然值;提取表示向量的向量长度与方向矢量,计算似然概率值对方向矢量的梯度,采用梯度上升方法对方向矢量进行更新同时保持向量长度不变,得到净化向量;通过选择与最终净化向量相似度最高的类别文本嵌入向量,将类别文本嵌入向量对应的图像类别作为类别文本嵌入向量的分类结果。
本发明授权基于多模态模型CLIP的隐空间净化的图像分类方法及装置在权利要求书中公布了:1.一种基于多模态模型CLIP的隐空间净化的图像分类方法,其特征在于,包括: 初始步骤,将待分类图片输入图文多模态对比预训练模型的图像编码器,得到该待分类图片在隐空间上的表示向量;使用该图文多模态对比预训练模型的文本编码器,得到空类别文本所表示的空类别文本嵌入向量; 计算步骤,计算该表示向量和该空类别文本嵌入向量的似然概率值; 迭代步骤,提取该表示向量的向量长度与方向矢量,计算该似然概率值对该方向矢量的梯度,采用梯度上升方法对该方向矢量进行更新同时保持该向量长度不变,得到净化向量;再次执行该计算步骤和该迭代步骤,直到该似然概率值收敛,保存当前净化向量作为最终向量; 分类步骤,该图文多模态对比预训练模型通过选择与该最终向量相似度最高的类别文本嵌入向量,将该类别文本嵌入向量对应的图像类别作为该类别文本嵌入向量的分类结果; 其中,该计算步骤采用文生图扩散模型估计该表示向量的似然概率值;该计算步骤包括:该文生图扩散模型以该空类别文本嵌入向量为先验条件,计算该表示向量在条件扩散逆过程的噪声预测值;根据该噪声预测值,通过基于变分下界理论估计该表示向量的该似然概率值;或 该计算步骤采用该表示向量与该空类别文本嵌入向量间的余弦相似度,估计该表示向量的似然概率值;该计算步骤包括:计算该空间表示和该空类别文本嵌入向量间的余弦相似度;将该余弦相似度作为该似然概率值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算技术研究所,其通讯地址为:100080 北京市海淀区中关村科学院南路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励