北京工业大学樊金山获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京工业大学申请的专利一种基于动态卷积注意力的图像语义分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116129115B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310010194.2,技术领域涉及:G06V10/26;该发明授权一种基于动态卷积注意力的图像语义分割方法是由樊金山;肖创柏;段娟;禹晶设计研发完成,并于2023-01-04向国家知识产权局提交的专利申请。
本一种基于动态卷积注意力的图像语义分割方法在说明书摘要公布了:本发明公开了一种基于动态卷积注意力的图像语义分割方法,以实现对原始图像的语义分割,利用ResNet101网络对原始图像进行特征提取,生成高层特征和低层特征;将高层特征通过不同尺度的自适应池化层,生成四组不同尺寸的标准卷积核,利用卷积层对标准卷积核进行线性组合,生成初始动态卷积核;利用空间注意力机制增强初始动态卷积核的特征提取能力,生成最终动态卷积核,用生成不同尺寸的最终动态卷积核实现多尺度处理;利用高层特征的语义信息,生成低层特征的通道权重,对低层特征的通道信息进行重新加权,将低层特征和高层特征进行特征融合。本发明能够有效的提取多尺度信息,利用高层特征的语义信息和低层特征的细节信息,提高语义分割的准确率。
本发明授权一种基于动态卷积注意力的图像语义分割方法在权利要求书中公布了:1.一种基于动态卷积注意力的图像语义分割方法,其特征在于,包含以下步骤: 步骤1.特征提取; 骨干网络是具有101层卷积层的ResNet101残差网络,该网络共有五组残差结构:第一组是一层卷积层,第二组至第五组分别由3个、4个、23个和3个残差结构构成,每个残差结构由三个卷积层组成,这三个卷积层的卷积核尺寸分别为1×1、3×3和1×1;在第四组和第五组残差结构中,将滑动步长设置为1,并将其中的卷积层分别替换为膨胀率为2和4的膨胀卷积层,扩大感受域; 步骤2.利用多尺度动态卷积注意力模块MDAM提取多尺度信息; MDAM由四个动态卷积注意力模块DAM组成,高层特征通过四个并联的DAM聚合多尺度语义信息,随后和原始高层特征沿通道连接,通过一个1×1的卷积层输入到解码器部分; 步骤2.1生成动态卷积核; ResNet101特征提取网络提取到的高层特征,通过自适应平均池化得到一组标准卷积核,利用1×1的卷积层对标准卷积核沿通道进行线性组合,生成尺寸为k×k的动态卷积核,为了增强核参数的空间上下文信息交互,利用空间注意力机制对生成的初始动态卷积核的参数进行重调,公式如下所示: Fk=σf3×3[AvgPoolfk;MaxPoolfk] 式中,fk代表的是尺寸为k×k的动态卷积核,f3×3代表的是卷积核尺寸为3×3的卷积操作,σ代表的是用Sigmoid激活函数进行激活操作,Fk代表的是计算出的动态卷积核的核参数权重;将计算出的核参数权重和初始卷积核相应位置的参数相乘,得到最终的动态卷积核; 步骤2.2提取多尺度信息; 通过步骤2.1生成四组尺寸不同的动态卷积核,其中k∈[1,3,5,7],并将提取到的高层特征通过1×1的卷积层降维;用生成的动态卷积核,通过深度可分离卷积的方式,聚合高层特征中的多尺度语义信息, 将提取到的多尺度特征和原始高层特征沿通道连接,通过一个1×1的卷积层降维,输入到解码器部分; 步骤3.利用特征指导模块FGM指导低层特征进行通道选择,并进行特征融合; 将步骤2的输出作为高层特征,通过全局池化层,聚合高层特征的全局语义信息,为了增强相邻通道间的信息交互,利用四组不同尺寸的一维卷积层提取不同尺度的通道信息,随后通过1×1的卷积层降维,得到低层特征的通道权重,将低层特征各通道和得到的通道权重逐通道相乘,利用高层特征中丰富的语义信息指导低层特征进行通道选择,增强对分割性能有益的通道,抑制其他通道;将上采样后的高层特征和经过通道权重调整后的低层特征进行特征融合; 步骤4.更新网络参数,判断收敛; 通过以上步骤,进行对图像语义分割结果的一次迭代求解,获得分割结果后,利用损失函数计算本次迭代的损失值,采用动量梯度下降法进行优化,并更新网络参数;当达到最大迭代次数或者迭代收敛时,停止迭代,输出最终的分割结果;否则重复步骤1、步骤2和步骤3。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励