Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 济南大学张永峰获国家专利权

济南大学张永峰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉济南大学申请的专利混合字体文本的动态数据处理与识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120148038B

龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510626154.X,技术领域涉及:G06V30/14;该发明授权混合字体文本的动态数据处理与识别方法及装置是由张永峰;陈星;陈月辉;丁冬睿;李佩庚;李彦辉;赵晖;田新栋设计研发完成,并于2025-05-15向国家知识产权局提交的专利申请。

混合字体文本的动态数据处理与识别方法及装置在说明书摘要公布了:本发明的一种混合字体文本的动态数据处理与识别方法及装置,属于光学字符识别技术领域,方法包括如下步骤:采集待处理的混合字体文本图像并输入增强型DBNet检测网络定位文本区域;集成轻量级MobileNetV3字体分类子网络,与检测主干共享底层特征,经联合损失函数训练多任务网络,输出带字体类型标签的文本区域;然后依标签选识别分支,印刷体用传统CRNN识别;手写体以线性可变卷积替代传统卷积,靠热力图引导核动态缩放,在BiLSTM层嵌入多头注意力机制识别;最后融合结果,输出带标签的检测与识别结果。本发明提高了混合字体文本数据处理与识别精度,增强了手写体文本识别的适应性和鲁棒性,满足多样文本识别需求。

本发明授权混合字体文本的动态数据处理与识别方法及装置在权利要求书中公布了:1.一种混合字体文本的动态数据处理与识别方法,其特征在于,包括如下步骤: S1,采集待处理的混合字体文本图像,并输入增强型DBNet文本检测网络对图像中文本区域进行定位检测,所述增强型DBNet文本检测网络在FPN特征金字塔中嵌入坐标注意力机制,通过多尺度特征融合建立空间位置与通道特征的动态关联,输出概率图和阈值图; S2,集成轻量级MobileNetV3字体分类子网络,与检测主干共享底层特征,并设计联合损失函数,进行多任务联合学习框架网络训练,输出带字体类型标签的文本区域,所述联合损失函数包括检测损失与分类损失; S3,根据字体类型标签选择对应的识别分支,对于印刷体文本区域,基于传统CRNN网络,经由卷积层、循环层、转录层对印刷体文本进行识别; S4,对于手写体文本区域,采用线性可变卷积替代传统卷积,通过热力图引导的核动态缩放适应连笔变形,并在CRNN网络的BiLSTM层嵌入多头注意力机制,建立转折点时空关联模型对手写体文本进行识别; S5,融合手写体文本识别结果与印刷体文本识别结果,输出带有标签的文本检测区域结果及识别结果; 通过热力图引导的核动态缩放适应连笔变形的过程包括: 在卷积神经网络的Stage-2输出后插入一个轻量级分支,通过轻量级卷积增强连笔区域的特征表示,同时降低计算复杂度; 通过公式计算热力图的均值; 依据热力图均值对后续卷积层的核权重进行动态调整:, 其中,是可学习参数;当连笔程度较高时,增强局部动态卷积的权重以适应形变区域;连笔较少时,保持基础卷积的特征提取能力; 学习一个仿射变换矩阵,补偿连笔导致的缩放、剪切和平移: 33, 其中,,控制方向的缩放,适应字符的宽度变化;,控制剪切角度,模拟连笔导致的倾斜形变;,负责平移,补偿书写偏移造成的局部位移误差; 对仿射矩阵进行奇异值分解并约束其变换矩阵为对角矩阵: 34; 使用一个动态掩膜来调整卷积核的权重: 35, 其中,是基础卷积核权重,是动态掩膜,由卷积与Sigmoid生成,每个位置的值表示该处卷积核的响应增强程度;当时,增强连笔形变区域的卷积核响应,当时抑制背景噪声; 建立转折点时空关联模型的过程包括: 在CRNN网络的BiLSTM层嵌入多头注意力机制,将输入特征映射至多个不同的表示子空间,每个子空间内独立执行自注意力机制,捕捉输入序列中不同位置之间的上下文依赖; 通过公式将输入特征分别映射为查询Q、键K和值V: 36, 其中,W Q、W K和W V是可学习的权重矩阵,X是输入特征; 计算注意力权重: 37, 其中,是键向量的维度; 对V进行加权求和得到当前时间步的上下文表示; 将输入特征并行传入多个注意力头,分别计算注意力表示,通过拼接操作融合各头输出,再经线性变换进一步整合,得到包含丰富上下文依赖的全局表示。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人济南大学,其通讯地址为:250000 山东省济南市市中区南辛庄西路336号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。