山东大学张阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东大学申请的专利一种基于扩散模型的结构表观异常跨模态识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121236610B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511783921.4,技术领域涉及:G06V20/10;该发明授权一种基于扩散模型的结构表观异常跨模态识别方法及系统是由张阳;曾东洋;申伟;丁鹏设计研发完成,并于2025-12-01向国家知识产权局提交的专利申请。
本一种基于扩散模型的结构表观异常跨模态识别方法及系统在说明书摘要公布了:本发明提供了一种基于扩散模型的结构表观异常跨模态识别方法及系统,涉及异常识别技术领域,包括:获取目标结构体的待识别表观图像;针对待识别的异常类型,构建异常识别指令;将待识别表观图像和异常识别指令输入到训练后的图文跨模态识别模型中,执行异常识别的视觉任务,得到包含语义分割结果的目标图像;其中,所述图文跨模态识别模型基于扩散模型构建,将异常识别的视觉任务转换成受图像条件和指令条件约束的图像生成;本发明将工程与地质结构体的表观图像和任务指令输入到构建的图文跨模态识别模型中,得到图像的语义分割结果,实现表观异常像素级精细化识别。
本发明授权一种基于扩散模型的结构表观异常跨模态识别方法及系统在权利要求书中公布了:1.一种基于扩散模型的结构表观异常跨模态识别方法,其特征在于,包括: 获取目标结构体的待识别表观图像; 针对待识别的异常类型,构建异常识别指令; 将待识别表观图像和异常识别指令输入到训练后的图文跨模态识别模型中,执行异常识别的视觉任务,得到包含语义分割结果的目标图像; 其中,所述图文跨模态识别模型基于扩散模型构建,将异常识别的视觉任务转换成受图像条件和指令条件约束的图像生成; 所述异常识别指令,由主指令和先验知识组成,其中,主指令是将待识别的异常类型嵌入到主指令模版中,先验知识包括待识别的异常类型的几何形态、纹理特征、颜色对比度及常见混淆因素; 主指令与先验知识均通过语言模型的文本编码器转化为语义向量,其中主指令编码后生成任务语义向量CT,先验知识编码后生成弱先验语义向量Eprior; 采用弱先验注入策略,仅在文本空条件位置引入弱先验语义向量,使图文跨模态识别模型在逆向扩散过程中保留对异常形态的低强度感知,具体为: 所述弱先验语义向量仅在完全无条件分支中引入,用于提供语义背景约束,含图像或文本条件的分支保持原始结构不变,最终预测的噪声用公式表示为: 其中,为综合加权后预测的最终噪声,表示由输入图像经 VAE 编码得到的视觉条件,表示主指令编码后生成任务语义向量;表示扩散过程中的带噪声图像潜在表示,表示对应输入被置空,以获得无条件分支,为仅有弱先验语义向量条件指导下预测的噪声,为仅由图像条件指导下预测的噪声,为图像和文本双条件指导下预测的噪声,t表示扩散步,SI表示图像引导系数,ST表示文本引导系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:250000 山东省济南市历下区经十路17923号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励