华南理工大学徐向民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种联合多维度的视觉注意方法及其介质和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116486225B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310098214.6,技术领域涉及:G06V10/82;该发明授权一种联合多维度的视觉注意方法及其介质和设备是由徐向民;周欣欣;郭锴凌设计研发完成,并于2023-02-10向国家知识产权局提交的专利申请。
本一种联合多维度的视觉注意方法及其介质和设备在说明书摘要公布了:本发明公开了一种联合多维度的视觉注意方法及其介质和设备,涉及深度学习领域,针对现有技术中视觉注意方法对模型特征权重的提取问题提出本方案。在注意力模块中,分别将空间两个维度和通道维度联合,在通道注意中嵌入空间注意,提高不同维度信息的交互性。并通过全局的形式获取空间注意,增强对空间位置关系的建模。其优点在于,多维度的联合有效增强信息交互,并且通过维度压缩,高效地获取空间的全局信息,减少计算开销。该注意方法可以灵活地应用到经典的卷积神经网络中,提高模型特征的提取能力,进而提高图像分类精度。
本发明授权一种联合多维度的视觉注意方法及其介质和设备在权利要求书中公布了:1.一种联合多维度的视觉注意方法,其特征在于,包括以下步骤: S1、构建数据集和确定通道压缩率; S2、建立卷积神经网络模型,添加视觉注意力模块到卷积神经网络中每个卷积组合块的末端,其中,在联合多维度的视觉注意力模块中,分离特征图的空间维度,分别对通道按比例进行压缩聚合,编码空间信息,提取全局特征,之后对注意力图的各个维度进行扩张还原,得到两个注意力图; S3、将提取到的多维注意力图沿着输入特征图不同的空间维度进行重新加权,并基于数据集对模型使用梯度下降法进行迭代训练,得到用于对图像进行分类的图像分类模型,将待分类图像输入所述图像分类模型中,即可对图像进行分类; 步骤S2的联合多维度的视觉注意力模块的具体操作包括: 联合多维度,聚合空间特征:给定输入,其中表示通道维度,、表示空间的两个维度,表示实数域,对两个空间维度和使用全局平均池化,分别沿着水平坐标和垂直坐标聚集空间特征,生成一对具有方向感知能力的特征图; 聚合通道特征:在通道维度上连接沿维度和维度的特征图,并采用共享的卷积变换函数聚合通道特征,得到在水平方向和垂直方向上聚合通道特征后的中间特征图,然后沿着空间维度将拆分成两个独立的矩阵和,是通道在聚合时的缩减比; 编码空间信息:通过自注意力模块对特征图和建模空间的全局依赖,对不同维度提取信息的权重进行共享,对和编码空间信息后,分别得到输出特征图和; 特征维度还原:经过空间注意得到特征图和后,连接特征图并通过共享的卷积变换函数扩张通道特征,得到 其中,表示沿着空间维度的拼接操作,是Sigmoid激活函数,表示在水平方向和垂直方向上还原通道大小后的特征图,然后沿着空间维度将分成两个独立的矩阵,得到和两个注意力图; 输出特征图和的表达式为 表示自注意力函数,表示ReLU激活函数; 自注意力模块中,输入矩阵通过三个权重分别为的全连接层,经过线性变换分别得到矩阵,将查询矩阵和转置后的键矩阵经过矩阵相乘,并除以通道维度后使用函数进行归一化,最后与值矩阵进行矩阵相乘得到输出: 上标T表示转置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励