中国科学技术大学吕文君获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利一种水下图像超分辨与目标识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119067848B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411154805.1,技术领域涉及:G06T3/4053;该发明授权一种水下图像超分辨与目标识别方法是由吕文君;陈妍;康宇;季海波设计研发完成,并于2024-08-22向国家知识产权局提交的专利申请。
本一种水下图像超分辨与目标识别方法在说明书摘要公布了:本发明涉及水下成像探测技术领域,公开了一种水下图像超分辨与目标识别方法,具体包括:编码器包括卷积层和深度特征提取部分;使用卷积层对输入的水下图像进行下采样,提取得到初始的特征,然后将依次输入到由多个正交双向注意力模块组成的深度特征提取部分;将特征输入依次输入到上尺度器和卷积层,得到水下图像的重建图像;将编码器输出的特征输入到特征金字塔网络;将多个对齐后的感兴趣区域进行连接后,输入到卷积层,得到目标的分类结果和目标的边界盒。能够显著提升图像的信噪比与清晰度,为目标识别性能的提升奠定了基础。
本发明授权一种水下图像超分辨与目标识别方法在权利要求书中公布了:1.一种水下图像超分辨与目标识别方法,其特征在于,所采用的超分辨目标识别模型包括编码器、解码器和特征金字塔网络;具体包括以下步骤: 步骤一,编码器包括卷积层和深度特征提取部分;使用卷积层对输入的水下图像I进行下采样,提取得到初始的特征F0,然后将F0依次输入到由A个正交双向注意力模块组成的深度特征提取部分;A个正交双向注意力模块分别输出不同层次提取的特征F1、F2、…、FA,对F0、F1、F2、…、FA进行拼接,得到编码器输出的特征C1; 步骤二,解码器包括上尺度器和卷积层;将特征C1输入依次输入到上尺度器和卷积层,得到水下图像的重建图像 步骤三,将编码器输出的特征C1输入到特征金字塔网络;特征金字塔网络包括自下向上路径、自上向下路径以及横向连接路径;自下向上路径使用深度残差网络;使用区域选取网络对自上向下路径中的各个特征图提取感兴趣区域,并进行对齐;将多个对齐后的感兴趣区域进行连接后,输入到卷积层,得到目标的分类结果和目标的边界盒; 所述正交双向注意力模块包括多个交替的卷积层和注意力模块,用于对输入的特征F交替进行卷积操作和注意力操作; 注意力模块包括两个双向长短期记忆网络,第一个双向长短期记忆网络沿着特征F的每一行,从左到右以及从右到左对像素逐个扫描,获得两个特征图,第一个双向长短期记忆网络将两个特征图拼接后输出以组合每个像素的左上下文信息和右上下文信息,第二个双向长短期记忆网络沿着第一个双向长短期记忆网络输出的特征图以自下而上和自上而下的顺序扫描特征图的每一列,并通过拼接获得整体特征图;使用卷积层将整体特征图转换为D个通道,形成特征权重α,其中D=W×H,W,H分别为输入的特征F的宽和高;对于所述特征权重α中位置w,h处的像素的特征向量pw,h∈RD,使用卷积层将维度变为C×W×H后使用softmax函数进行归一化,得到一个新的特征权重αw,h∈RD,再通过对每个像素生成的新的特征权重αw,h进行加权,得到上下文特征Fatt: 第i个通道新的特征权重通过下式求得: 为第i个通道的特征权重α中位置w,h处的像素的特征向量; 对于位置w,h处的像素参与的与F大小相同的上下文特征Fatt通过以下公式得到: 其中,fw,h∈RD为F中位置w,h处的卷积特征,为Fatt中位置w,h处的特征; 所述超分辨目标识别模型的训练策略包括: 1计算成对相似图一致性损失: 将两个超分辨目标识别模型的自编码器网络分别定义为第一自编码器网络Aθ1、第二自编码器网络Aθ2,两个超分辨目标识别模型的结构相同但初始化方式不同,所述编码器和解码器构成自编码器网络,两个超分辨目标识别模型的特征金字塔网络分别记为第一特征金字塔网络Fθ1、第二特征金字塔网络Fθ2;Aθ1和Fθ1组成第一个超分辨目标识别模型,Aθ2和Fθ2组成第二个超分辨目标识别模型; 在自编码器网络中,对来自编码器的特征图Pe,即所述特征C1,和解码器输出的特征图Pd,即所述重建图像计算相似图一致性损失; 对于给定的批次大小B,Pe和Pd的形状分别为B×C×W×H和B×C'×W'×H',其中H和W分别为特征图Pe的宽和高,C为对应的特征通道数;W'和H'分别为特征图Pd的宽和高,C'为对应的特征通道数;为了计算相似图一致性损失,首先需要获得相似图矩阵,即格拉姆矩阵,根据自编码器网络Aθ1,Aθ2输出返回两对输入之间的相似度值;对相似图矩阵进行L2归一化,得到形状为B×B的成对相似图矩阵ψ,即对于第i个超分辨目标识别模型: ‖·‖2表示二范数,i∈{1,2},ψ1和ψ2别是自编码器网络Aθ1,Aθ2产生的相似图矩阵; 所提出的相似图一致性损失lsim为: LD·,·为均方根误差,分别表示Aθ1,Aθ2中特征图Pe的相似图矩阵,分别表示Aθ1,Aθ2输出的特征图Pd的相似图矩阵; 2进行交叉标签监督: 将第一个超分辨目标识别模型和第二个超分辨目标识别模型输出的分类结果分别作为伪标签Y1和Y2,将伪标签Y1和Y2作为监督信号:用伪标签Y2作为第一个超分辨目标识别模型的监督,用伪标签Y1作为第二个超分辨目标识别模型的监督,并用交叉熵损失函数和Dice损失函数共同进行约束,得到第一个超分辨目标识别模型的损失和第二个超分辨目标识别模型的损失 其中α是平衡两个损失项的贡献的超参数;lce·,·是交叉熵损失函数;ldice·,·是Dice损失函数;i∈{1,2};则交叉标签监督总损失eY为: 所述训练策略总损失函数为:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。