南京邮电大学霍智勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种基于混合神经网络模型的单目图像深度估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116934825B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310918311.5,技术领域涉及:G06T7/50;该发明授权一种基于混合神经网络模型的单目图像深度估计方法是由霍智勇;赵丽萍设计研发完成,并于2023-07-25向国家知识产权局提交的专利申请。
本一种基于混合神经网络模型的单目图像深度估计方法在说明书摘要公布了:本发明属于计算机视觉领域,公开了一种基于混合神经网络模型的单目图像深度估计方法,包括:给定RGB图像和真实深度值,进行标准化操作,将RGB图像经过卷积模块,得到浅层的图像特征,然后将特征划分为块,进行不同区域的特征强化,得到带有重要程度判别的特征并将该特征依次经过Transformer模块,得到深层的特征,将浅层的图像特征与深层的特征组成图像特征序列,进行特征融合,得到完整的特征表示后利用深度信息输出块,获得的深度图,将深度图与真实深度值进行误差分析,得到最终的网络模型,完成深度估计。本发明建立了局部信息和远距离依赖关系,增强了对空间特征的捕获和对局部结构的表达,实现更准确的深度估计结果。
本发明授权一种基于混合神经网络模型的单目图像深度估计方法在权利要求书中公布了:1.一种基于混合神经网络模型的单目图像深度估计方法,其特征在于:所述单目图像深度估计方法包括如下步骤: 步骤1、给定RGB图像和其对应的真实深度值; 步骤2、对给定RGB图像进行标准化操作,使其符合步骤3中卷积模块的输入要求; 步骤3、经过标准化操作的RGB图像依次经过2个卷积模块,得到浅层的图像特征; 步骤4、将步骤3获得的浅层的图像特征划分为块,利用块注意力模块进行不同区域的特征强化,得到带有重要程度判别的特征; 步骤5、将步骤4得到的带有重要程度判别的特征依次经过Transformer模块,得到深层的特征; 步骤6、将步骤3获得的浅层的图像特征与步骤5得到深层的特征组成不同尺度的图像特征序列,在特征融合模块中由深到浅依次进行特征融合,得到完整的特征表示; 步骤7、将步骤6得到完整的特征表示,利用深度信息输出块,将其映射到对应的深度表示,获得的深度图; 步骤8、将步骤7获得的深度图与步骤1中RGB图像的真实深度值利用平移不变性损失进行误差分析,在目标损失最小的条件下,优化模型,得到最终的网络模型,完成深度估计,其中: 所述步骤4将卷积捕捉到的浅层的图像特征通过块注意力模块转化为具有不同重要性的块,再送入Transformer模块,产生更具代表性的标记,块注意力模块在垂直和水平方向上聚合浅层的图像特征,捕捉远距离的依赖关系,并保留精确的位置信息,具体包括如下步骤: 步骤4-1、由卷积模块生成浅层的图像特征图,并将其分割为块 分别使用两个平均池化ph,1或1,pw来编码每个通道沿水平坐标和垂直坐标,得到: 其中,和分别表示第c个通道在高度ph和宽度pw处的输出,i为垂直方向的第i个特征块,j为水平方向的第j个特征块,p为特征块的数量; 步骤4-2、将和的输出相连,再利用卷积进行变换: f=δF1[zph,zpw] 其中,[zph,zpw]表示沿空间维度的连接操作,δ非线性激活函数,f是中间特征映射; 步骤4-3、沿着空间维度将f分割成两个单独的序列fph和fpw,同时,另外两个1×1卷积变换Fph和FPw被用来分别将fph和fpw转换为具有与输入块相同通道数的序列, gph=σFphfph gpw=σFpwfpw 其中,σ表示sigmoid函数,fph和fpw是两个单独的序列,Fph和FPw是两个1×1卷积变换,gph和gpw是两个权重, 式中,x′ci,j是加权的块,然后被嵌入到标记中进行进一步处理,xci,j表示输入的块,和是两个空间权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。