清华四川能源互联网研究院田榆杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华四川能源互联网研究院申请的专利一种基于模板优先与自适应模型优选的可扩展OCR智能识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121354141B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511891853.3,技术领域涉及:G06V30/41;该发明授权一种基于模板优先与自适应模型优选的可扩展OCR智能识别方法及系统是由田榆杰;唐昱梦;张睿;陈茏;程浩然;黄瑞;张甜设计研发完成,并于2025-12-16向国家知识产权局提交的专利申请。
本一种基于模板优先与自适应模型优选的可扩展OCR智能识别方法及系统在说明书摘要公布了:本发明涉及档案数字化管理技术领域,具体而言,涉及一种基于模板优先与自适应模型优选的可扩展OCR智能识别方法及系统,主要包括了判断当前目标图像是否属于历史图表模板库内的模板,若是,则将文字识别结果和当前匹配的模板进行融合后输出;若否,对目标图像进行表格识别。本发明在模板优先基础上把“区域分割的属性与置信度”显式注入到候选生成—对齐—融合—一致性优化的全流程中,通过系统的统一目标将几何、拓扑与置信度校准耦合求解:在模板命中时以软先验显著提升处理效率与稳定性,从而在识别精度、信息完整性、处理效率与数据安全方面较现有技术实现全面提升,能够更好地满足行业档案数字化管理的严苛要求。
本发明授权一种基于模板优先与自适应模型优选的可扩展OCR智能识别方法及系统在权利要求书中公布了:1.一种基于模板优先与自适应模型优选的可扩展OCR智能识别方法,其特征在于,包括: 获取当前的待识别图像,对待识别图像进行预处理,得到目标图像; 对目标图像进行文字识别,获取历史图表模板库,判断当前目标图像是否属于历史图表模板库内的模板,若是,则将文字识别结果和当前匹配的模板进行融合后输出; 若否,则基于区域分割网络对目标图像进行区域划分,得到每个区域的区域置信度,对目标图像进行表格识别,得到每个区域的融合置信度; 根据融合置信度是否小于预设的置信度阈值,判断是否将当前区域的识别结果替换为原始图像后,与文字识别结果进行融合后输出; 所述对目标图像进行表格识别包括: 利用区域分割的属性向量与区域置信度作为先验因子; 获取多组结构的候选,并对候选进行拓扑-几何对齐与置信度融合; 所述对候选进行拓扑-几何对齐与置信度融合包括: 其中,为候选自身置信度,为候选中的参考单元格,为融合置信度,为区域自适应权重; 在融合结构上施加中心到顶点的双向几何一致性,与,行和列连贯及合并关系的拓扑一致性,输出表格网格与合并关系,计算每个区域的融合置信度,并输出; 所述中心到顶点的双向几何一致性包括: 其中,为顶点到中心的几何投影,为中心到顶点的逆映射,为几何一致性损失项,为中心一致性项的权重系数,为单元格中心,为四顶点集合,为坐标值,为顶点一致性项的权重系数; 施加行和列连贯及合并关系的拓扑一致性包括: 式中,惩罚相邻单元格在行向或列向的错位,为合并关系一致性约束函数,为拓扑一致性损失项,为相邻单元格边集合,为边权参数,为合并一致性项的权重系数,为单元格跨度信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华四川能源互联网研究院,其通讯地址为:610213 四川省成都市天府新区湖畔路北段366号天府新经济产业园A区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励