中国电子科技集团公司第三十研究所刘世钰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团公司第三十研究所申请的专利一种基于多模态大语言模型的图像伪造检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121236571B 。
龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511798342.7,技术领域涉及:G06V20/00;该发明授权一种基于多模态大语言模型的图像伪造检测方法是由刘世钰;杨慧;张翔;刘方;康荣保;饶志宏设计研发完成,并于2025-12-02向国家知识产权局提交的专利申请。
本一种基于多模态大语言模型的图像伪造检测方法在说明书摘要公布了:本发明涉及图像检测技术领域,提供一种基于多模态大语言模型的图像伪造检测方法,包括:向多模态大语言模型输入待检测图像;多模态大语言模型输出待检测图像的真伪鉴定结果;其中,所述多模态大语言模型中具有物理一致性、语义一致性和底层结构线索分析三个并行的专家分支。本发明通过充分利用多模态大语言模型的强大先验知识、深度语义理解能力、链式推理能力,来感知图像中的语义信息,理解图像的上下文逻辑和物理逻辑,同时能够通过自然语言对伪造图像进行复杂的推理和解释。
本发明授权一种基于多模态大语言模型的图像伪造检测方法在权利要求书中公布了:1.一种基于多模态大语言模型的图像伪造检测方法,其特征在于,包括: 向多模态大语言模型输入待检测图像; 多模态大语言模型输出待检测图像的真伪鉴定结果;其中,所述多模态大语言模型中具有物理一致性、语义一致性和底层结构线索分析三个并行的专家分支;所述多模态大语言模型输出待检测图像的真伪鉴定结果,包括: 待检测图像输入共享视觉编码模块,得到全局特征及局部特征; 将全局特征和局部特征输入多专家取证模块中的物理一致性专家分支、语义一致性专家分支和底层结构线索分析专家分支,分别得到物理特征向量、语义特征向量和底层结构特征向量; 将物理特征向量、语义特征向量和底层结构特征向量输入特征融合及专家提示序列生成模块进行特征融合并转换成专家提示序列; 提示词工程构建模块基于专家提示序列构建提示词工程; 大语言模型解码器模块根据提示词工程提供的提示词进行分析,得到待检测图像的真伪鉴定结果; 所述物理一致性专家分支中,将所述全局特征输入物理一致性专家分支后,经过一个轻量化的多层感知机输出物理特征向量;所述多层感知机中激活函数选择ReLu函数,输出头采用回归头与编码头的双头输出设计;回归头输出采用线性层,用来预测物理属性,编码头是将多层感知机主干输出投影到一个低维向量,该向量用来编码整个图像中物理不一致性的存在性及严重程度; 所述语义一致性专家分支中,将全局特征和局部特征输入所述语义一致性专家分支后,经过一个基于融合注意力机制的关系推理模块,该关系推理模块首先通过一个互注意力层,将局部特征作为和,将全局特征作为,计算增强后的特征向量;之后将增强后的特征向量输入到一个2层轻量化的Transformer编码器进行推理,最后对推理后生成的序列进行平均池化后接线性层,输出语义特征向量; 所述底层结构线索分析专家分支中,将所述局部特征输入底层结构线索分析专家分支后,首先将1D序列特征重新调整为2D特征图,之后将2D特征图输入到轻量级的卷积编码器;该卷积编码器由多个卷积块组成,每个卷积块包括一个卷积层,后接BN归一化层,激活函数选择ReLu函数,最后将卷积编码器处理之后的特征图进行平均池化后接线性层,得到底层结构特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第三十研究所,其通讯地址为:610041 四川省成都市高新区创业路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励