兰州交通大学邸敬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉兰州交通大学申请的专利一种基于条件扩散模型的红外与可见光图像融合方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119540070B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411540431.7,技术领域涉及:G06T5/50;该发明授权一种基于条件扩散模型的红外与可见光图像融合方法是由邸敬;王鹤然;石淑慧;朱云龙设计研发完成,并于2024-10-31向国家知识产权局提交的专利申请。
本一种基于条件扩散模型的红外与可见光图像融合方法在说明书摘要公布了:本发明公开了一种基于条件扩散模型的红外与可见光图像融合方法,属于图像融合技术领域。与目前流行的红外与可见光图像融合算法相比,该算法在色彩保真度、纹理细节保持和融合质量方面有了明显改进,不仅通过条件去噪扩散隐式模型和多通道高低频并行融合模型结合完成了特征提取和融合任务,缓解了去噪扩散隐式模型在执行图像融合任务时缺少融合结果的基准真实值的问题,而且进一步展现出去噪扩散隐式模型在图像处理中的独特优势,在生成高质量图像和数学可解释性方面表现出色,实现了已有方法的优化和已有技术的升级。
本发明授权一种基于条件扩散模型的红外与可见光图像融合方法在权利要求书中公布了:1.一种基于条件扩散模型的红外与可见光图像融合方法,其特征在于:具体实现步骤如下: S1、将已经配准好的单通道红外图像和三通道可见光图像拼接为四通道图像输入条件扩散模块,将自定义子集的先验分布近似为适合红外与可见光图像特征提取任务的先验分布,在条件扩散模块的前向扩散过程中,模型以马尔科夫链的形式在T步内逐步加入高斯噪声,多通道加噪图像Ft表示为: 其中,表示标准正态分布,和分别表示当前步长的多通道加噪图像和原始图像, 1-表示步长t前所有噪声方差之积,表示服从高斯分布; 在条件扩散模块的反向去噪过程中,模型通过T个时间步长逐步去除噪声,在时间步长 t处,多通道源图像的预测,记为,可表示为: 进一步地,在已知多通道有噪图像和多通道源图像时,可以推导出上一个时间步长 的多通道有噪图像,可表示为: 其中,表示时间步长t时噪声方差,表示有噪图像的条件分布的均值,可表 示为: 其中,表示去噪网络,和分别表示去噪网络的输入有噪多通道图像和时间步 长; S2、利用经过条件扩散模型学习到的最优先验分布,结合去噪生成过程和多通道似然 校正网络进行拼接源图像多通道特征分布的提取;在反向去噪生成过程中设置潜在空间引 入多通道似然校正网络,在每个时间步骤中,对多通道源图像的预测采用拼接后的四 通道图像结合多通道EM算法进行似然校正,在迭代过程中逐步引入语义信息,使去噪生成 结果能够更好地保留源图像的特征信息,通过在潜在空间中的扩散建模,实现对红外与可 见光图像多通道分布的精确模拟,计算过程可表示为: 其中,表示多通道源图像的预测和可见光特征之差,表示多通道源图像的预 测和红外特征之差,和表示潜在空间尺度参数,表示惩罚项; S3、截取条件扩散模型去噪生成过程中的三个不同时间步骤的生成结果,对其采用拼接操作,得到多阶段的拼接特征; S4、将去噪生成过程生成的多阶段红外和可见光特征通过细节自适应去噪网络进行四 通道图像特征的提取和高低频特征的分离,首先,将各时间步骤的拼接图像作为输入图像, 使用3×3大小的卷积核对输入图像进行初步特征提取和通道数对齐;然后,利用深度神经 网络编码器提取分层和抽象特征,并进行通道数对齐,利用编码器生成的分层特征图,将空 间和通道注意力机制应用于每一层特征图,可表示为: 其中,分别表示编码器第层处理前后的特征图,和分别表示编码器第层 通道和空间注意力的参数,表示卷积核大小为3的卷积,用于增强空间和通道注意力的 聚合能力; 最后,将编码器提取的特征映射送入解码器,利用语义和细节增强模块连接每一级的 编码器和解码器阶段;针对编码器的不同级别,选择相应的特征映射作为参考,利用上 下采样调整不同级别特征图的大小,以适应编码器特征图的分辨率,并进行逐元素相乘, 利用傅里叶变换在频域中进行中心频域滤波,选择性的滤除特征映射中的低频成分,保留 多通道高频扩散特征输出,计算过程可表示为: 其中,,和分别表示自适应平均池化、单位映射和最近邻上采样操作,和分别表示解码器第层处理前后的特征图,和分别表示的高度和宽度,表示逐 元素乘法,应用于所有调整分辨率的特征映射,和分别表示傅里叶变换和反傅里 叶变换,为傅里叶掩码,为中心滤波半径,为阈值频率; S5、在去噪网络解码器阶段通过当前级别特征图计算主干特征图平均值,实现对提 取特征的平衡调整;为避免提取的高频特征产生过于平滑的纹理,仅在当前级别的第一层 使用全通道的缩放操作,将后续层级缩放操作限制在的半通道,保留多通道低频扩散特 征输出,计算过程可表示为: 其中,和分别表示特征映射的通道数和当前所属解码器层级,表示的第个通 道; S6、对经过细节自适应去噪网络提取到的图像扩散特征进行输出,细节自适应去噪网络的解码器包含5个卷积层级别,每一级别采用1×1卷积核分别输出当前阶段提取到的多通道高频扩散特征和多通道低频扩散特征,与高频特征对应的图称为细节图,而低频特征对应的图称为基础图; S7、对细节自适应去噪网络提取到的多通道高频扩散特征经过自适应区域一致性融合网络进行高频特征融合,首先,对提取到的多通道高频扩散特征应用对称填充操作,增加一个像素的边框,使用3×3窗口进行最大值滤波,最大值滤波器可表示为: 其中,表示输出图像,表示以为中心的3×3矩阵的像素值,表示 取最大值; 然后,对经过最大化处理后多通道高频扩散特征应用符号函数生成活动图,使用一个3×3卷积层将高维融合特征映射到128通道输出,根据输出的局部区域计算每个像素的阈值,并根据自适应阈值生成映射矩阵,计算过程可表示为: 其中,表示符号函数,和表示不同的滤波图像,表示卷积矩 阵的映射值,表示映射矩阵; 最后,将映射矩阵中参数0替换为红外图像对应的像素,参数1替换为可见光图像对应 的像素,再经卷积层映射得到融合细节图; S8、对细节自适应去噪网络提取到的多通道低频扩散特征经过多通道低频特征融合网络进行低频特征融合,先对这些多通道低频特征采用最近邻上采样和1×1卷积核进行组合处理,再通过一系列卷积核为3×3的卷积层,将低维信息特征映射到3通道输出,得到融合基础图; S9、对经过自适应区域一致性融合网络得到的以高频特征为主导的融合细节图和经过多通道低频特征融合网络得到的以低频特征为主导的融合基础图采用Concat策略进行融合,重构生成红外与可见光的融合图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人兰州交通大学,其通讯地址为:730070 甘肃省兰州市安宁区安宁西路118号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励