南昌大学闵卫东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南昌大学申请的专利一种基于混合注意力与特征增强的文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117079260B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311057677.4,技术领域涉及:G06V20/62;该发明授权一种基于混合注意力与特征增强的文本检测方法是由闵卫东;张曙光;李嘉豪设计研发完成,并于2023-08-22向国家知识产权局提交的专利申请。
本一种基于混合注意力与特征增强的文本检测方法在说明书摘要公布了:本发明提供了一种基于混合注意力与特征增强的文本检测方法,S1,采集自然场景下的文本图像并对图像进行预处理;S2,将特征送入到FPN中进入特征提取,首先特征经过卷积核为1×1的卷积操作后,各层特征均变成通道数为256维的特征;后续特征会自顶向下的顺序进入到混合注意力融合模块MAF模块操作,在MAF模块中高层的语义信息作用于底层特征,融合多个特征的上下文信息;S3,输出的多个特征图进行拼接操作后,自适应特征增强模块AFE模块使网络的注意权重在空间维度上更加灵活,捕捉到特征信息。本发明在网络中提出混合注意力融合模块和自适应特征增强模块可以减少背景噪声对文本检测的干扰和提升对小尺度文本的检测能力。
本发明授权一种基于混合注意力与特征增强的文本检测方法在权利要求书中公布了:1.一种基于混合注意力与特征增强的文本检测方法,其特征在于:包括以下步骤: S1,采集自然场景下的文本图像并对图像进行预处理; S2,采用ResNet18作为主干网络,并对其进行修改,将ResNet-18的第二层到第五层的普通卷积更换为可变形卷积;将特征送入到FPN中进入特征提取,首先特征经过卷积核为1×1的卷积操作后,各层特征均变成通道数为256维的特征;后续特征会自顶向下的顺序进入到混合注意力融合模块MAF模块操作,在MAF模块中高层的语义信息作用于底层特征,融合多个特征的上下文信息; S3,输出的多个特征图进行拼接操作后,自适应特征增强模块AFE模块使网络的注意权重在空间维度上更加灵活,捕捉到特征信息; 其中,所述混合注意力融合模块的输入为Pi和Outi+1,P为此层特征,Out为下一层特征的结果;计算过程如下表示: 式中,代表特征元素相加,代表特征元素相乘,Up表示双线性插值操作;CM表示通道维度的注意力,所述通道维度的注意力是通道维度不进行改变,而对空间维度进行压缩操作,所述通道维度的注意力对应设置有通道注意力模块;SM表示空间维度的注意力,所述空间维度的注意力是空间维度不进行任何改变,在通道维度进行相应的压缩操作,之后再去学习空间维度上的特征信息,所述空间维度的注意力对应设置有空间注意力模块; 所述自适应特征增强模块的处理过程如下: S=Concat[Out2,Out3,Out4,P5] 式中,Avg表示为平均池化操作,Conv3代表卷积核为3×3的卷积操作,Conv1代表卷积核为1×1的卷积操作;ReLu表示为ReLu激活函数,σ表示为Sigmoid激活函数,和分别表示两个特征图对应元素进行相加或相乘的操作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南昌大学,其通讯地址为:330000 江西省南昌市红谷滩新区学府大道999号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励