Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华南师范大学吴立军获国家专利权

华南师范大学吴立军获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华南师范大学申请的专利一种用于光场超分辨率的多视图信息注意力交互网络系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115147271B

龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210431821.5,技术领域涉及:G06F17/40;该发明授权一种用于光场超分辨率的多视图信息注意力交互网络系统是由吴立军;段尧明;吴钰;阮啸寅;李强设计研发完成,并于2022-04-22向国家知识产权局提交的专利申请。

一种用于光场超分辨率的多视图信息注意力交互网络系统在说明书摘要公布了:本发明公开了一种用于光场超分辨率的多视图信息注意力交互网络,一组低分辨率的光场图像作为网络的输入,顶部分支包含重塑过程、特征提取模块、四个双注意力模块;底部分支包含特征提取模块和四个多视图注意力模块;这两条支路提取的特征信息共同汇聚到融合重建模块,首先利用全局图像特征更新每个单视角图像特征,使得每个视角特征能够融合全局视角特征,再经过上采样模块,最后与输入图像的双三次上采样图像相加得到最后的输出图像。本发明利用多视图注意力模块让全局视角的权重大小变得不一样,从而能够更好、更合理地融合不同视图之间的信息。本发明在图像细节和纹理重建效果方面均比其他方法更好,视觉效果更接近于地面真实图像。

本发明授权一种用于光场超分辨率的多视图信息注意力交互网络系统在权利要求书中公布了:1.一种用于光场超分辨率的多视图信息注意力交互网络系统,其特征在于,包括顶部分支、底部分支、融合重建模块和上采样模块; 所述顶部分支包含依次串联的重塑过程、特征提取模块和四个双注意力模块;并将四个双注意力模块的输出进行级联; 所述底部分支包含依次串联的特征提取模块和四个多视图注意力模块;并将四个多视图注意力模块的输出进行级联; 将一组低分辨率的光场图像作为网络的输入,分别经过顶部分支和底部分支提取光场图像的特征信息;这两条支路提取的特征信息共同汇聚到融合重建模块,融合重建模块首先利用全局图像特征更新每个单视角图像特征,使得每个视角特征能够融合全局视角特征,再经过上采样模块,最后与输入图像的双三次上采样图像相加得到最后的输出图像; 利用残差密集空洞空间金字塔池化模块和残差块作为网络的特征提取模块;选择卷积核扩张率为1、2和5;通过级联多个空洞卷积层,越往后的神经元就能获得越来越大的感受野;扩张率为1、2和5的空洞卷积感受野分别为3×3、5×5和11×11,级联后的感受野为17×17;将每一层的输入和输出的特征结合起来作为下一层的输入;经过1×1的卷积层进行压缩通道,再经过空洞卷积层后被修正线性单元函数激活;最后在网络末端使用1×1卷积层对提取到的三个特征进行融合;网络最终生成的特征能够非常密集的覆盖多个尺度范围;通过快捷连接的方式,使得网络学习的是一种残差映射; 网络的输入低分辨率子孔径图像表示为I代表光场图像,ILR代表低分辨率光场图像,是多维实数空间;LR是低分辨率;N是光场全部视角个数;其中N=U×V;U、V是光场的角度分辨率大小,U=V=5;W、H是子孔径图像的图像大小,W=H=32;对应的网络输出高分辨率子孔径图像表示为其中ISR代表高分辨率光场图像;SR是高分辨率;α是网络的放大倍数;在底部分支中,输入ILR经过特征提取模块后,输出的特征为C是网络输入的特征通道数;整个过程表示如下: Fviews=HFEMILR1-1 其中,Fviews是提取到的特征,HFEM表示特征提取模块的作用函数,称为浅层特征提取器;Fviews不仅提取了单视角图像的特征信息,还保留了视图之间的相关性,用于方便后续对其视图特征之间权重的学习;在顶部分支中,输入ILR经过重塑形状后再经过特征提取模块,得到的输出特征为Fglobal融合了视图之间原有的相关性,提取了全局视图的特征信息,用于关注全局图像内部隐藏的信息,方便后续对其在空间位置和通道上权重的学习; 顶部分支中特征提取模块的输出特征作为双注意力模块的输入特征Ftopin,将输入的特征Ftopin分别进行沿垂直方向的一维全局池化操作和沿水平方向的全局池化操作,用于沿着垂直方向和水平方向对每个通道进行编码,得到一对方向感知注意力图;整个过程表示如下: 其中,HXGAP和HYGAP分别代表沿着水平和垂直方向的一维全局池化函数;FXGAP和FYGAP分别是生成的水平特征和竖直特征;生成的 通过这两种变换,不仅拥有对一个空间方向的全局依赖,而且保留了另一个空间方向的精确位置信息;接着将生成的两个特征级联后,通过一个共享的1×1的卷积层和修正线性单元激活层,得到中间特征其中γ表示压缩通道的比率,用于减少计算量;整个过程表示如下: FMid=δH1×1[FXGAP,FYGAP]1-3 其中,δ表示修正线性单元激活函数,H1×1表示共享的1×1的卷积层,[·]表示级联操作;FMid包含了水平方向和竖直方向的空间信息;接着沿着空间维度将FMid切分成两个单独的特征向量和经过一个1×1的卷积层将两个特征向量扩充到和输入相同的通道数;再经过Sigmoid激活层,得到和整个过程表示如下: 其中,FHS为纵向输出特征,FWS为水平输出特征,σ表示Sigmoid激活函数;最后将两个方向的特征向量与输入相乘,得到的输出为: Ftopout=Ftopin*FHS*FWS1-5 式中,Ftopout为学习到的空间-通道注意力特征,*表示两个特征向量中对应位置元素相乘;至此,双注意力模块把水平方向和竖直方向的空间信息通过在通道上加权的方式融合,实现了同时对空间和通道的注意力;在双注意力模块的末端,Ftopout通过两个残差块,再与输入相加,得到双注意力模块的输出k表示第k个双注意力模块输出,k=1,2,3,4;将四个双注意力模块的输出特征级联起来,再与特征提取模块提取的浅层特征Fglobal叠加,得到顶部分支的最终输出为: 其中,FTop为顶层分支的最终输出特征,分别是第一个、第二个、第三个、第四个双注意力模块的输出特征;H1×1为1×1的卷积层,用于将级联后的特征通道数从4C减少到C; 底部分支中特征提取模块的输出特征作为多视图注意力模块的输入特征Fbotin,首先需要变换输入的特征Fbotin维度,使得接着将特征Fbotin分别通过最大值全局池化层和平均值全局池化层进行压缩,得到和FGMP全局最大值特征,FGAP全局平均值特征;随后两个特征向量经过共享的网络层,网络层包含两个1×1的卷积层和修正线性单元激活层;两个1×1的卷积层的作用分别是压缩通道和扩充通道,压缩比率为θ,用于减少计算量;再将两个特征向量求和后,经过Sigmoid激活层,最后与输入特征相乘后输出;整个过程表示如下: 其中,表示压缩通道的1×1的卷积层权重,表示扩充通道的1×1的卷积层权重,在多视图注意力模块末端,特征FMA经过两个残差块后,与输入Fbotin叠加求和,得到模块最终输出将四个多视图注意力模块的输出特征级联起来,再与特征提取模块提取的浅层特征Fviews叠加,得到底部分支的最终输出特征为FBottom,并变换其维度;具体过程表示如下: 其中,分别为第一、二、三、四个多视图注意力模块的输出特征,H1×1为1×1的卷积层,用于将级联后的特征通道数从4C减少到C; 首先利用全局图像特征FTop更新每个单视角图像特征FBottom,使得每个视角特征能够融合全局视角特征;具体过程如下:沿着通道维度,将FTop与FBottom中每个视角特征级联起来得到融合特征再经过1×1的卷积层将通道数从2C压缩到C,然后通过修正线性单元激活层得到融合特征将Ffus2中每个视角特征在通道维度级联起来得到融合特征再通过共享的1×1的卷积层和修正线性单元激活层,用于让每个视角特征能够共享相互学习到的信息;最后重塑回原始维度输入到残差蒸馏模块; 由四个残差蒸馏块组成,四个残差蒸馏块生成的特征被级联起来,再通过一个1×1的卷积层进行压缩通道和一个3×3的卷积层,最后与输入叠加求和得到输出特征FFRM;整个过程表示如下: 其中,分别为第一、二、三、四个残差蒸馏块的输出特征,为最终得到的融合特征,作为残差蒸馏模块的输入特征;H3×3为3×3的卷积层,H1×1为1×1的卷积层,用于将级联后的特征通道数从4C减少到C; 采用蒸馏机制逐步提取和处理分层特征:残差蒸馏块对输入的特征分成两个部分,一个部分通过一个1×1的卷积层和修正线性单元激活层,以比例ε压缩特征通道,得到实现信息蒸馏操作;另一部分经过一个3×3的卷积层、一个快捷连接分支和一个修正线性单元激活层后,得到进行下一次信息蒸馏;等到重复三次后,特征经过一个3×3的卷积层以比例ε压缩特征通道得到随后与之前三次得到的 级联,再通过一个1×1的卷积层压缩通道,最后通过快捷连接与输入叠加求和得到最终输出整个过程表示如下: 其中,Fin为残差蒸馏块的输入特征,分别为第一、二、三、四次信息蒸馏得到的蒸馏特征;为第一、二、三次信息蒸馏得到的剩余特征;为第i个残差蒸馏块的输出特征;通过这种方式,逐步提取有用的信息,并以高效的方式提高SR性能; 从融合重建模块获得的特征FFRM最终被馈送到上采样模块,首先通过一个1×1的卷积层对FFRM进行通道扩张,通道扩张的比率和上采样的倍数相关,比率大小等于上采样因子α的平方;然后经过像素混合层,生成大小为目标分辨率αH×αW的特征图;最后经过一个1×1的卷积层将通道数压缩成1,并与经过双三次上采样后的输入ILR叠加求和得到超分辨率重建结果ISR。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南师范大学,其通讯地址为:510000 广东省广州市中山大道西55号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。