安徽理工大学夏晨星获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽理工大学申请的专利基于实例级自适应深度估计的单目三维目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116703996B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310517996.2,技术领域涉及:G06T7/50;该发明授权基于实例级自适应深度估计的单目三维目标检测方法是由夏晨星;赵文俊;葛斌;高修菊;崔建华;陶展鹏;段秀真;王晶晶设计研发完成,并于2023-05-09向国家知识产权局提交的专利申请。
本基于实例级自适应深度估计的单目三维目标检测方法在说明书摘要公布了:本发明属于计算机视觉领域领域,提供了一种基于实例级自适应深度估计的单目三维目标检测算法,包括以下步骤:首先利用从ImageNet中训练好的DLA‑34主干网络,作为编码器从输入图像中编码初始多层次特征;然后,利用全局的特征表示,将预测最终深度值作为离散深度区间中心值和实例特征概率表示的线性组合,结合二维目标检测区域分布获得实例级的稀疏深度图,并得到隐含的深度空间线索特征信息;之后,利用空间增强注意力模块将深度线索特征信息引入三维目标检测分支,并通过金字塔池化操作学习不同尺度下的目标空间特征表示;最后,利用多个损失函数分层优化多个检测任务的监督学习,并利用混合损失函数训练此模型。
本发明授权基于实例级自适应深度估计的单目三维目标检测方法在权利要求书中公布了:1.基于实例级自适应深度估计的单目三维目标检测方法,其特征在于,该方法包括以下步骤: 1.1利用从ImageNet中训练好的DLA-34主干网络,作为编码器从输入图像中编码初始多层次特征; 1.2利用全局的特征表示,将预测最终深度值作为离散深度区间中心值和实例特征概率表示的线性组合,结合二维目标检测区域分布获得实例级的稀疏深度图,并得到隐含的深度空间线索特征信息;所述步骤1.2具体方法是: 3.1首先,选择骨干网络的第4层深度的特征图作为输入;随后,为了逐步扩展接受域,增强网络从局部到全局的特征提取能力,采用三个不同扩张率的非对称卷积层提取三组相同大小的上下文特征;然后,通过元素级逐级相加来整合上下文信息,实现这些特征与不同尺度的融合;利用通道注意模块进一步增强融合区域的特征,增强关键区域的信息,同时抑制不重要区域的干扰;最后,该模块产生了两个特征输出:一个是空间注意力处理后的特征图,另一个是通过全局平均池化操作应用于融合的特征图得到的n维向量b;将向量b归一化,求和为1,得到箱宽向量b,如下式所示: 其中∈=10-3的确保每个箱子的宽度大小是严格为正数; 3.2利用DLA-34主干网络的第5层深度的特征图作为输入,该特性表示高分辨率和局部像素级信息;将其输入一个3×3卷积层,并利用自适应箱宽度估计模块的特征映射进行元素添加,以更好地补充全局和细粒度信息;然后,通过1×1的卷积层,将特征通道添加到N中,这需要与向量b维度保持一致;为了指导模型聚焦于局部对象特征,使用RoIAlign来裁剪和调整RoI特征的大小;RoI特征只包含对象级特征,而不包括背景噪声;最后,通过全局平均池化GAP为每个对象在进行池化为大小7×7×N的RoI特征,并通过Softmax计算得到一个P∈R1x1xN概率分布; 3.3最后,给定自适应箱子宽度测试模块中预测的箱子长度b,它首先通过一个简单的后处理过程将它们转换为箱子中心,具体如下式所示: 其中cbi是ith箱的中心深度,dmax和dmin最小值是最大值和数据集的最小有效深度值,最后通过下面公式线性组合得到最终深度值: 1.3利用空间增强注意力模块将深度线索特征信息引入三维目标检测分支,并通过金字塔池化操作学习不同尺度下的目标空间特征表示,提高模型的空间感知能力,利用其融合后的特征作为检测头部的特征输入;所述步骤1.3具体方法是: 4.1首先在特征X上应用两个带有1×1滤波器的卷积层,生成两个新的特征图QueryQ和KeyK,其中{Q,K}是新特征图的降低通道数;然后将Q和K在它们的空间维度上重塑为RC′×N,其中N=H×W;同时,另一个卷积层也使用1×1滤波器与Y特征图相连,生成ValueV; 4.2利用金字塔的多尺度采样,并在特征图K和V上应用核大小为{8,6,3,2}的金字塔池化层;通过融合模块,将特征图Q、池化后的K和V在通道维度上分成n个块,每个块都利用不同通道的信息,从而使每个注意力头可以在注意力图中学习不同的信息;最后,在特征S上应用一个SoftMax层来计算空间注意图a=N×N';然后对S应用SoftMax层,计算空间注意力图;接下来对块A和合并后的V的转置进行矩阵乘法;将所有结果连接起来并重塑为RH×W×C; 4.3在不同比例的K和V上重复所有过程并求和以得到结果M;最后,通过元素级加法操作X和来自多个尺度的求和结果来收集上下文信息;具体如下式所示: Oi=γMi+Xi,4 其中i是X中的每个位置,γ是一个可学习的尺度参数;它被初始化为0,并逐渐学会分配更多的权重; 1.4利用多个损失函数分层优化多个检测任务的监督学习,分为二维目标检测任务损失和三维目标检测任务损失,并利用混合损失函数训练此模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽理工大学,其通讯地址为:232001 安徽省淮南市山南新区泰丰大街168号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励