清华大学深圳国际研究生院袁春获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学深圳国际研究生院申请的专利一种基于笔划区域分割策略的视觉文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117115824B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310617471.6,技术领域涉及:G06V30/148;该发明授权一种基于笔划区域分割策略的视觉文本检测方法是由袁春;李磊设计研发完成,并于2023-05-29向国家知识产权局提交的专利申请。
本一种基于笔划区域分割策略的视觉文本检测方法在说明书摘要公布了:一种基于笔划区域分割策略的视觉文本检测方法,包括如下步骤:S1、通过基于卷积神经网络的前端处理模块,针对输入的文本图像执行特征提取和多级区域预测;S2、依据文本区域的多级预测结果提取文本级和笔划级的区域候选框,进而构建层次化的局部图结构;S3、通过基于图神经网络的后端处理模块,在各个局部图执行基于多级图节点的节点特征聚合和关系推理,推断不同级别图节点之间的关系并进行链接预测,将节点进行分组进而组成整体的文本实例检测结果。在视觉文本检测研究领域广泛采用的标准评估数据集上进行了实验,验证了本发明视觉文本检测方法的有效性、高精度和良好的泛化能力。
本发明授权一种基于笔划区域分割策略的视觉文本检测方法在权利要求书中公布了:1.一种基于笔划区域分割策略的视觉文本检测方法,其特征在于,包括如下步骤: S1、通过基于卷积神经网络的前端处理模块,对输入的文本图像执行特征提取和多级区域预测;所述前端处理模块包括主干图像特征提取网络、文本区域预测网络和笔划区域预测网络,通过一系列堆叠在特征金字塔主干图像特征提取网络之上的卷积层来执行与文本区域相关的多级预测; S2、依据文本区域的多级预测结果提取文本级和笔划级的区域候选框,各候选框所表示的图像区域作为图节点组成多个局部图结构,进而构建层次化的局部图结构; S3、通过基于图神经网络的后端处理模块,在各个局部图执行基于多级图节点的节点特征聚合和关系推理,推断不同级别图节点之间的关系并进行链接预测,根据各个文本级节点之间的链接关系将节点进行分组进而组成整体的文本实例检测结果; 步骤S1中,所述笔划区域预测网络将各个文本区域中的字符内容与复杂背景分离,其中,结合图像低级语义和高级语义信息来生成文本区域中精细的笔划分割表示,以指导后续的文本检测过程; 所述笔划区域预测网络包括两个阶段的预测过程; 1从主干网络获取到的输入图像的高级特征表示中提取与文本相关的特征;具体地,从输入图像中裁剪出TR的外部矩形OTR,并利用全局池化层结合连续的卷积层来提取从主干网络获取的OTR区域特征;利用若干池化层和多层感知器网络以及相关的非线性激活函数来计算输入图像的通道注意力特征图,以辨别和度量主干网络中的不同网络层对文本区域表示的相对贡献;在此期间,将提取到的输入特征图上采样到与输入图像相同的分辨率大小,然后将其乘以得到的通道注意力特征图从而实现对输入图像的语义信息蒸馏操作;由此,获得文本图像语义表示; 2精细建模文本区域的笔划表示,通过从正交方向上引入正交卷积网络来增强细粒度的笔划字符分割表示;具体地,将文本区域外接矩形OTR的3通道RGB原始输入特征作为补充的低级图像语义信息,并将其与获得的文本图像语义表示相融合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学深圳国际研究生院,其通讯地址为:518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。