Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山西大学白茹意获国家专利权

山西大学白茹意获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山西大学申请的专利一种基于多尺度融合与注意力机制的图像方向预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115761258B

龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211406464.3,技术领域涉及:G06V10/44;该发明授权一种基于多尺度融合与注意力机制的图像方向预测方法是由白茹意;郭小英;贾春花设计研发完成,并于2022-11-10向国家知识产权局提交的专利申请。

一种基于多尺度融合与注意力机制的图像方向预测方法在说明书摘要公布了:本发明公开了一种基于多尺度融合与注意力机制的图像方向预测方法,属于计算机视觉与图像处理技术领域。针对图像方向的自动预测问题,本发明通过将ResNet50网络后四部分的最后一个残差结构输出特征图,分别经过一个注意力机制模块,得到4个空间注意力图,并与对应的原特征图对应元素相加。然后将三个较小尺度的特征用双线性插值上采样至与最大尺度相同的分辨率,再沿通道进行拼接得到最终的多尺度注意力融合特征,称为局部特征。其次,将图像的4个不同尺度的VR_LBP特征图作为网络输入,采用ResNet50融合残差空洞卷积得4个特征图,再将特征图对应元素相加得到全局特征。最后,将局部特征与全局特征进行拼接融合,再经过GAP和全连接层最终实现方向预测。

本发明授权一种基于多尺度融合与注意力机制的图像方向预测方法在权利要求书中公布了:1.一种基于多尺度融合与注意力机制的图像方向预测方法,其特征在于:包括以下步骤: 步骤1,将每幅图像分别顺时针旋转三个角度:90度,180度和270度,每幅图像最终会得到上、右、下、左四个不同方向的图像; 步骤2,采用ResNet50融合残差注意力机制提取每幅图像的局部特征,具体步骤如下: 步骤2.1,ResNet50网络由6部分组成,分别是:卷积层、C0、C1、C2、C3和C4;所述C0包含1个7×7步长为2的卷积层与1个3×3步长为2的最大池化层;所述C1、C2、C3和C4分别是原图的14,18,116和132倍,且分别包含3、4、6和3个瓶颈层BTNK; 步骤2.2,将C1、C2、C3、C4各部分的最后一个残差结构输出特征图分别记为C1、C2、C3、C4;在四个不同尺度的特征图上分别经过一个注意力机制模块CBAM,分别得到4个空间注意力图记为A1、A2、A3、A4; 步骤2.3,将空间注意力图与对应的原特征图进行对应元素相加,记为Fi=Ai⊕Cii=1,2,3,4,其中,⊕表示对应元素相加; 步骤2.4,将F2、F3、F4三个小尺度的特征图用双线性插值上采样至与F1相同的尺度,沿通道进行拼接操作,再进行1×1的卷积操作,得到最终的多尺度注意力融合特征,局部特征,记为:Local_Feature=concatF1,up_2xF2,up_4xF3,up_8xF4;其中,concat表示特征拼接,up_2x表示上采样2倍; 步骤3,将图像的4个不同尺度的旋转可变局部二值模式特征图VR_LBP作为网络输入,采用ResNet50融合残差空洞卷积提取图像的全局特征,具体步骤如下; 步骤3.1,图像在标准三原色模式RGB中,计算能表达图像“方向”特性的VR_LBP特征图;计算过程中采用4个不同的尺度VR_LBP1,8、VR_LBP2,16、VR_LBP3,24和VR_LBP4,32生成4个VR_LBP特征图,分别记作P,P,P,P,并作为RestNet50网络的输入; 步骤3.2,将P,P,P和P四个不同尺度的VR_LBP特征图输入到RestNet50中,将RestNet50网络最后一个卷积块的输出特征图记为RP、RP、RP、RP;将这4个特征图分别输入对应采样率的残差空洞卷积块,4个采样率rates分别对应VR_LBP特征图中的R值;经过残差空洞卷积块后得到4个特征图记为RPD、RPD、RPD、RPD,将RPD、RPD、RPD、RPD4个特征图对应元素相加得到全局特征;Global_Feature=RPD⊕RPD⊕RPD⊕RPD 步骤4,将步骤2.4中得到的局部特征与步骤3.2中得到的全局特征进行拼接融合,最终实现方向预测; 步骤4.1,将局部特征Local_Feature通过双线性插值下采样至与全局特征Global_Feature相同的分辨率,然后进行拼接连接,得到融合后的特征;LG_Feature=concatdownLocal_Feature,Global_Feature,down表示下采样; 步骤4.2,将LG_Feature经过一个全局平均池化,得到一个一维向量;再经过一个256的全连接层实现图像方向的预测; 步骤4.3,将逻辑回归极大似然损失函数作为损失函数实现方向分类,实现图像方向的自动预测,损失函数定义如下: 其中,hθx表示样本x属于某一类的概率;yi为预测的方向类别,xi表示第i个样本特征,m为样本个数,θ为网络模型所求参数,T表示矩阵的转置。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山西大学,其通讯地址为:030006 山西省太原市坞城路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。