Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 宁波大学姜求平获国家专利权

宁波大学姜求平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉宁波大学申请的专利一种基于退化信息引导的水下图像质量评价方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115170936B

龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210654333.0,技术领域涉及:G06V20/05;该发明授权一种基于退化信息引导的水下图像质量评价方法是由姜求平;顾约瑟;邵枫设计研发完成,并于2022-06-10向国家知识产权局提交的专利申请。

一种基于退化信息引导的水下图像质量评价方法在说明书摘要公布了:本发明公开了一种基于退化信息引导的水下图像质量评价方法,其构建图像增强网络和质量评价网络;使用原始水下图像及对应的伪标签图像构成的第一训练集对图像增强网络进行训练,最终得到图像增强网络训练模型,并冻结参数;利用水下图像增强方法对原始水下图像进行增强,再将每幅原始水下图像对应的水下增强图像进行两两组合成图像对,所有图像对构成第二训练集;第二训练集中的水下增强图像通过图像增强网络训练模型输出四幅中间层特征图,同时使用第二训练集对质量评价网络进行训练,四幅中间层特征图引入到该训练过程中,最终得到质量评价网络训练模型;优点是能自动提取出质量相关特征,且能有效地提高客观评价结果与主观感知之间的相关性。

本发明授权一种基于退化信息引导的水下图像质量评价方法在权利要求书中公布了:1.一种基于退化信息引导的水下图像质量评价方法,其特征在于包括以下步骤: 步骤1:构建两个神经网络,第一个神经网络作为图像增强网络,第二个神经网络作为质量评价网络; 图像增强网络包括1个第一卷积块、4个第二卷积块、4个第三卷积块、4个第四卷积块、1个第五卷积块,由第一卷积块、第1个第二卷积块、第2个第二卷积块、第3个第二卷积块、第4个第二卷积块构成编码网络,由第1个第三卷积块、第2个第三卷积块、第3个第三卷积块、第4个第三卷积块构成通道注意力模块,由第1个第四卷积块、第2个第四卷积块、第3个第四卷积块、第4个第四卷积块、第五卷积块构成解码网络;第一卷积块的输入通道数为3、输出通道数为32,第一卷积块的输入端作为图像增强网络的输入端同时接收一幅尺寸为H×W的RGB图像的R、G、B三个通道,将第一卷积块的输出端输出的尺寸为的特征图记为FE1;第1个第二卷积块的输入通道数为32、输出通道数为32,第1个第二卷积块的输入端接收FE1,将第1个第二卷积块的输出端输出的尺寸为的特征图记为FE2;第2个第二卷积块的输入通道数为32、输出通道数为64,第2个第二卷积块的输入端接收FE2,将第2个第二卷积块的输出端输出的尺寸为的特征图记为FE3;第3个第二卷积块的输入通道数为64、输出通道数为128,第3个第二卷积块的输入端接收FE3,将第3个第二卷积块的输出端输出的尺寸为的特征图记为FE4;第4个第二卷积块的输入通道数为128、输出通道数为256,第4个第二卷积块的输入端接收FE4,将第4个第二卷积块的输出端输出的尺寸为的特征图记为FE5;第1个第三卷积块的输入通道数为32、输出通道数为32,第1个第三卷积块的输入端接收FE2,将第1个第三卷积块的输出端输出的尺寸为的特征图记为FC1;第2个第三卷积块的输入通道数为64、输出通道数为64,第2个第三卷积块的输入端接收FE3,将第2个第三卷积块的输出端输出的尺寸为的特征图记为FC2;第3个第三卷积块的输入通道数为128、输出通道数为128,第3个第三卷积块的输入端接收FE4,将第3个第三卷积块的输出端输出的尺寸为的特征图记为FC3;第4个第三卷积块的输入通道数为256、输出通道数为256,第4个第三卷积块的输入端接收FE5,将第4个第三卷积块的输出端输出的尺寸为的特征图记为FC4;第1个第四卷积块的输入通道数为256、输出通道数为256,第1个第四卷积块的输入端接收FE5,将第1个第四卷积块的输出端输出的尺寸为的特征图记为FD1;第2个第四卷积块的输入通道数为512、输出通道数为128,第2个第四卷积块的输入端接收对FD1和FC4进行拼接操作后得到的尺寸为的特征图FDC1,将第2个第四卷积块的输出端输出的尺寸为的特征图记为FD2,同时将FDC1作为第一中间层特征图;第3个第四卷积块的输入通道数为256、输出通道数为64,第3个第四卷积块的输入端接收对FD2和FC3进行拼接操作后得到的尺寸为的特征图FDC2,将第3个第四卷积块的输出端输出的尺寸为的特征图记为FD3,同时将FDC2作为第二中间层特征图;第4个第四卷积块的输入通道数为128、输出通道数为32,第4个第四卷积块的输入端接收对FD3和FC2进行拼接操作后得到的尺寸为的特征图FDC3,将第4个第四卷积块的输出端输出的尺寸为的特征图记为FD4,同时将FDC3作为第三中间层特征图;第五卷积块的输入通道数为64、输出通道数为3,第五卷积块的输入端接收对FD4和FC1进行拼接操作后得到的尺寸为的特征图FDC4,将第五卷积块的输出端输出的尺寸为H×W×3的特征图记为FD5,同时将FDC4作为第四中间层特征图,将FD5作为RGB图像对应的图像退化信息,对RGB图像与其对应的图像退化信息进行逐元素相加,将逐元素相加得到的图像作为图像增强网络的输出端输出的增强结果图像; 质量评价网络包括1个第六卷积块、4个第七卷积块、12个第八卷积块、4个第九卷积块、4个全局平均池化模型、1个全连接层,由1个第六卷积块、4个第七卷积块、12个第八卷积块构成编码网络,由4个第九卷积块构成特征融合模块,由4个全局平均池化模型和1个全连接层构成回归网络;第六卷积块的输入通道数为3、输出通道数为64,第六卷积块的输入端同时接收一幅尺寸为H×W的RGB图像的R、G、B三个通道,第六卷积块的输入端接收的RGB图像与第一卷积块的输入端接收的RGB图像为同一幅,将第六卷积块的输出端输出的尺寸为的特征图记为FQ1;第1个第七卷积块的输入通道数为64、输出通道数为256,第1个第七卷积块的输入端接收FQ1,将第1个第七卷积块的输出端输出的尺寸为的特征图记为FQ2;第1个第八卷积块的输入通道数为256、输出通道数为256,第1个第八卷积块的输入端接收FQ2,将第1个第八卷积块的输出端输出的尺寸为的特征图记为FQ3;第2个第八卷积块的输入通道数为256、输出通道数为256,第2个第八卷积块的输入端接收FQ3,将第2个第八卷积块的输出端输出的尺寸为的特征图记为FQ4,并将FQ4作为第五中间层特征图;第2个第七卷积块的输入通道数为256、输出通道数为512,第2个第七卷积块的输入端接收FQ4,将第2个第七卷积块的输出端输出的尺寸为的特征图记为FQ5;第3个第八卷积块的输入通道数为512、输出通道数为512,第3个第八卷积块的输入端接收FQ5,将第3个第八卷积块的输出端输出的尺寸为的特征图记为FQ6;第4个第八卷积块的输入通道数为512、输出通道数为512,第4个第八卷积块的输入端接收FQ6,将第4个第八卷积块的输出端输出的尺寸为的特征图记为FQ7;第5个第八卷积块的输入通道数为512、输出通道数为512,第5个第八卷积块的输入端接收FQ7,将第5个第八卷积块的输出端输出的尺寸为的特征图记为FQ8,并将FQ8作为第六中间层特征图;第3个第七卷积块的输入通道数为512、输出通道数为1024,第3个第七卷积块的输入端接收FQ8,将第3个第七卷积块的输出端输出的尺寸为的特征图记为FQ9;第6个第八卷积块的输入通道数为1024、输出通道数为1024,第6个第八卷积块的输入端接收FQ9,将第6个第八卷积块的输出端输出的尺寸为的特征图记为FQ10;第7个第八卷积块的输入通道数为1024、输出通道数为1024,第7个第八卷积块的输入端接收FQ10,将第7个第八卷积块的输出端输出的尺寸为的特征图记为FQ11;第8个第八卷积块的输入通道数为1024、输出通道数为1024,第8个第八卷积块的输入端接收FQ11,将第8个第八卷积块的输出端输出的尺寸为的特征图记为FQ12;第9个第八卷积块的输入通道数为1024、输出通道数为1024,第9个第八卷积块的输入端接收FQ12,将第9个第八卷积块的输出端输出的尺寸为的特征图记为FQ13;第10个第八卷积块的输入通道数为1024、输出通道数为1024,第10个第八卷积块的输入端接收FQ13,将第10个第八卷积块的输出端输出的尺寸为的特征图记为FQ14,并将FQ14作为第七中间层特征图;第4个第七卷积块的输入通道数为1024、输出通道数为2048,第4个第七卷积块的输入端接收FQ14,将第4个第七卷积块的输出端输出的尺寸为的特征图记为FQ15;第11个第八卷积块的输入通道数为2048、输出通道数为2048,第11个第八卷积块的输入端接收FQ15,将第11个第八卷积块的输出端输出的尺寸为的特征图记为FQ16;第12个第八卷积块的输入通道数为2048、输出通道数为2048,第12个第八卷积块的输入端接收FQ16,将第12个第八卷积块的输出端输出的尺寸为的特征图记为FQ17,并将FQ17作为第八中间层特征图;第1个第九卷积块的第一输入端的输入通道数为256、第二输入端的输入通道数为64、输出通道数为64,第1个第九卷积块的第一输入端接收FQ4,第1个第九卷积块的第二输入端接收FDC4,将第1个第九卷积块的输出端输出的尺寸为的特征图记为FDQ1;第2个第九卷积块的第一输入端的输入通道数为512、第二输入端的输入通道数为128、输出通道数为128,第2个第九卷积块的第一输入端接收FQ8,第2个第九卷积块的第二输入端接收FDC3,将第2个第九卷积块的输出端输出的尺寸为的特征图记为FDQ2;第3个第九卷积块的第一输入端的输入通道数为1024、第二输入端的输入通道数为256、输出通道数为256,第3个第九卷积块的第一输入端接收FQ14,第3个第九卷积块的第二输入端接收FDC2,将第3个第九卷积块的输出端输出的尺寸为的特征图记为FDQ3;第4个第九卷积块的第一输入端的输入通道数为2048、第二输入端的输入通道数为512、输出通道数为512,第4个第九卷积块的第一输入端接收FQ17,第4个第九卷积块的第二输入端接收FDC1,将第4个第九卷积块的输出端输出的尺寸为的特征图记为FDQ4;第1个全局平均池化模型的输入通道数为64、输出通道数为64,第1个全局平均池化模型的输入端接收FDQ1,第1个全局平均池化模型的输出端输出尺寸为1×1×64的特征向量;第2个全局平均池化模型的输入通道数为128、输出通道数为128,第2个全局平均池化模型的输入端接收FDQ2,第2个全局平均池化模型的输出端输出尺寸为1×1×128的特征向量;第3个全局平均池化模型的输入通道数为256、输出通道数为256,第3个全局平均池化模型的输入端接收FDQ3,第3个全局平均池化模型的输出端输出尺寸为1×1×256的特征向量;第4个全局平均池化模型的输入通道数为512、输出通道数为512,第4个全局平均池化模型的输入端接收FDQ4,第4个全局平均池化模型的输出端输出尺寸为1×1×512的特征向量;对尺寸为1×1×64的特征向量、尺寸为1×1×128的特征向量、尺寸为1×1×256的特征向量、尺寸为1×1×512的特征向量进行拼接操作,得到尺寸为1×1×960的特征向量,记为Fiqa1;全连接层的输入通道数为960、输出通道数为1,全连接层的输入端接收Fiqa1,全连接层的输出端输出一个数值,该数值代表RGB图像的质量预测分数; 步骤2:选取N1幅不同场景下的原始水下图像及每幅原始水下图像对应的伪标签图像构成第一训练集;其中,N1≥800,原始水下图像和伪标签图像的尺寸为H×W,即原始水下图像和伪标签图像的高度为H且宽度为W; 步骤3:将第一训练集中的每幅原始水下图像的R、G、B三个通道同时输入到图像增强网络中进行训练,图像增强网络输出第一训练集中的每幅原始水下图像对应的增强结果图像,然后针对第一训练集中的每幅伪标签图像,计算损失函数值,记为LossIE,其中,表示均方误差损失函数值,“||||2”为l2范数运算符号,Iresult表示原始水下图像Iraw对应的增强结果图像,Ipseudo表示原始水下图像Iraw对应的伪标签图像,表示感知损失函数值, 表示感知损失网络即VGG-16网络,1≤j≤16,表示VGG-16网络中的第j层卷积层,表示Iresult输入到VGG-16网络中第j层卷积层输出的特征图,表示Ipseudo输入到VGG-16网络中第j层卷积层输出的特征图,Hj×Wj×Cj表示和的尺寸,Hj表示和的高度,Wj表示和的宽度,Cj表示和的通道数; 步骤4:使用第一训练集按照步骤3的过程训练100轮以上,最终训练得到图像增强网络训练模型,并在后续的训练中冻结参数; 步骤5:选取N2幅不同场景下的原始水下图像;然后利用N3种不同的水下图像增强方法对每幅原始水下图像进行增强处理,得到每幅原始水下图像对应的N3幅水下增强图像;再针对每幅原始水下图像对应的N3幅水下增强图像,将N3幅水下增强图像排成一排,将每幅水下增强图像与位于其后的各幅水下增强图像两两组合成图像对,共得到N3-1+N3-2+…+1对图像对;之后将N2×N3-1+N3-2+…+1对图像对构成第二训练集;其中,N2≥100,N3≥10,原始水下图像的尺寸为H×W,即原始水下图像的高度为H且宽度为W; 步骤6:将第二训练集中的每对图像对的每幅水下增强图像的R、G、B三个通道同时输入到图像增强网络训练模型中,图像增强网络训练模型输出第二训练集中的每对图像对的每幅水下增强图像对应的第一中间层特征图、第二中间层特征图、第三中间层特征图、第四中间层特征图,将第二训练集中的任意一对图像对的任意一幅水下增强图像对应的第一中间层特征图、第二中间层特征图、第三中间层特征图、第四中间层特征图对应记为F'DC1、F'DC2、F'DC3、F'DC4; 同时,将第二训练集中的每对图像对的每幅水下增强图像的R、G、B三个通道同时输入到质量评价网络的编码网络中,质量评价网络的编码网络输出第二训练集中的每对图像对的每幅水下增强图像对应的第五中间层特征图、第六中间层特征图、第七中间层特征图、第八中间层特征图,将第二训练集中的任意一对图像对的任意一幅水下增强图像对应的第五中间层特征图、第六中间层特征图、第七中间层特征图、第八中间层特征图对应记为F'Q4、F'Q8、F'Q14、F'Q17;然后将第二训练集中的每对图像对的每幅水下增强图像对应的第四中间层特征图和第五中间层特征图、第三中间层特征图和第六中间层特征图、第二中间层特征图和第七中间层特征图、第一中间层特征图和第八中间层特征图成对输入到质量评价网络的特征融合模块中,质量评价网络输出第二训练集中的每对图像对的每幅水下增强图像对应的质量预测分数;再针对第二训练集中的每对图像对,计算损失函数值,记为Lossquality,Lossquality=max0,-R×Q1-Q2+margin,其中,max为取最大值函数,Q1表示每对图像对的第一幅水下增强图像对应的质量预测分数,Q2表示每对图像对的第二幅水下增强图像对应的质量预测分数,margin为常数,margin=0.5,R表示每对图像对的第一幅水下增强图像与第二幅水下增强图像的主观偏好值,若主观偏好于第一幅水下增强图像则R=1,若主观偏好于第二幅水下增强图像则R=-1; 步骤7:使用第二训练集按照步骤6的过程训练100轮以上,最终训练得到质量评价网络训练模型; 步骤8:任意选取一幅尺寸为H×W的水下图像,并记为T;然后将T的R、G、B三通道同时输入到图像增强网络训练模型和质量评价网络训练模型中,质量评价网络训练模型输出T的质量预测分数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人宁波大学,其通讯地址为:315211 浙江省宁波市江北区风华路818号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。