Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山西大学白鹤翔获国家专利权

山西大学白鹤翔获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山西大学申请的专利基于边缘特征增强的任意形状文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115880707B

龙图腾网通过国家知识产权局官网在2025-12-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210717862.0,技术领域涉及:G06V30/414;该发明授权基于边缘特征增强的任意形状文本检测方法是由白鹤翔;王浩然设计研发完成,并于2022-06-21向国家知识产权局提交的专利申请。

基于边缘特征增强的任意形状文本检测方法在说明书摘要公布了:本发明属于图像处理技术领域,具体涉及一种基于边缘特征增强的任意形状文本检测方法,主要解决了现有基于深度学习文本检测方法对于文本对象检测不准确的问题。本发明将现有基于深度学习的文本检测方法作为文本检测分支,首先增添文本边缘区域检测分支从而提高模型对文本边缘区域的检测能力,然后通过浅层特征增强模块使得模型能够更多地提取到与边缘区域相关地浅层特征,最后,模型通过分支特征融合模块通过注意力机制突出两个检测分支的特征中的相关特征,并在进行融合后对两个检测分支进行调整。本发明的优点在于通过增强模型对于文本边缘相关特征的提取,提高了文本检测的精度。

本发明授权基于边缘特征增强的任意形状文本检测方法在权利要求书中公布了:1.一种基于边缘特征增强的任意形状文本检测方法,其特征在于,所述方法包括以下3个步骤: 步骤A:获取所包含文本对象边界框标记的图像集合作为训练样本集,并对训练样本集中的每一幅图像进行预处理; 步骤B:利用基于残差网络ResNet的深度学习模型对步骤A所述训练样本进行训练,得到训练好的文本检测学习模型; 步骤B所述基于残差网络的深度学习模型具体为: 步骤B1、将所述步骤A中预处理过的样本图像作为的输入,得到特征图,并使用特征金字塔进行初步的特征融合得到特征; 步骤B2、浅层特征增强模块首先使用卷积处理特征获取各像元在更大尺度上的深层特征,将深层特征从融合后的特征中以相减的方式剥离得到尽可能保留更多浅层信息的特征;随后,将特征同最高分辨率的特征进行拼接和卷积以增强浅层特征得到特征;最后将特征与特征逐像元相加作为后续文本检测的图像特征; 步骤B3、将特征通过不同的卷积处理以构建面向文本实例与其边缘的特征,得到文本区域特征和文本边缘区域特征;为了突出最具有代表性的特征并抑制无关特征,分别对特征和使用注意力机制模块处理以对不同特征赋予不同的权重,其中权重的获取是通过SE通道注意模块完成;经过注意力机制处理的特性和再通过拼接和两次卷积后进行融合以得到同时包含两者信息的混合特征; 步骤B4、在完整文本实例检测分支中,首先根据特征使用先卷积后激活的方法得到文本实例区域初始分割结果;随后采用自适应二值化方法过滤文本实例区域初始分割结果中被错误分割的像元;其中首先使用特征得到文本阈值,然后再使用二值化方法将文本实例区域初始分割结果和文本阈值进行融合从而得到最终的文本实例区域分割结果,具体公式为:,其中为文本实例区域初始分割结果,为文本阈值; 步骤B5、在文本实例边缘检测分支中,首先根据特征使用先卷积后激活的方法获得初始边缘区域分割结果;随后在初始边缘区域分割结果基础上融合了混合特征信息以及部分文本实例区域初始分割结果信息;对于混合特征信息也采用了先卷积后激活的方法得到每个像元归属于边缘区域的概率信息;对于文本实例区域初始分割结果则采用RPCNet中的方法,从计算空间梯度的方式从文本实例区域初始分割结果中得到边缘信息,具体公式为:,其中是激活函数,为内核大小为的自适应平均池化操作;最后将三个信息进行拼接、卷积和激活后得到最终的文本边缘预测结果; 根据文本边缘区域特征获得内核区域分割图; 步骤B6、为解决训练过程中存在着正负样本不均衡问题,首先使用OHEM方法根据正负样本比例将分割结果和实际标签进行掩膜处理,得到掩膜后的结果为和,再使损失函数计算损失,具体公式为:,其中和分别为分割结果和实际标签掩膜后的像素值; 步骤C:对没有标记的训练集图像,根据步骤B训练好的学习模型对其进行预测,得到文本区域分割图以及内核区域分割图,并使用PSE算法通过渐进扩张的方式得到最终的文本区域预测结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山西大学,其通讯地址为:030006 山西省太原市小店区坞城路92号山西大学科技楼803;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。