上海云钠信息科技有限公司方钰权获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海云钠信息科技有限公司申请的专利一种基于深度学习的表单识别系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116311308B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310370831.7,技术领域涉及:G06V30/412;该发明授权一种基于深度学习的表单识别系统是由方钰权设计研发完成,并于2023-04-10向国家知识产权局提交的专利申请。
本一种基于深度学习的表单识别系统在说明书摘要公布了:本发明公开了一种基于深度学习的表单识别系统,具体涉及智能表单识别领域,包括文档形式转换模块、表格扫描确认拆分模块、单元格内容提取模块、表单基础信息采集模块、表格信息提取检验模块、信息内容分类模块、信息内容匹配模块、识别能力指数计算模块、识别结果判断模块以及判断结果反馈模块,本发明通过对纸质文档进行扫描,转换成图片文件,并将图像文件进行识别,之后定位图像文件里的表格,并对表格内容进行提取,分类,匹配,通过计算表格识别的完整度和准确度,以及计算数据的数据分类能力和匹配能力,得到表单识别系统的识别能力指数,对识别能力指数进行判断和数据反馈到系统维护终端。
本发明授权一种基于深度学习的表单识别系统在权利要求书中公布了:1.一种基于深度学习的表单识别系统,其特征在于:包括: 文档形式转换模块:用于将纸质文档利用扫描仪转换为图像文件,并通过识别软件将图像中的文字转换成文本格式; 表格扫描确认拆分模块:用于确认目标表格,利用基于深度学习的目标检测方法,对文本内的表格进行检测以及确定表格范围并对确定的目标表格中的各单元格进行拆分; 单元格内容提取模块:用于接收目标表格的各单元格的范围信息,并使用OCR技术,对目标表格中的内容进行提取; 表单基础信息采集模块:用于采集所要识别的文档内包含表单的基础信息内容,具体包括原有表格的个数、原有各表格包含的数据个数、提取到的表格个数、提取到的各表格包含的数据个数、将正确数据分类为正确数据的个数、错误数据分类为错误数据的个数、将正确数据分类为错误数据的个数以及将错误数据分类为正确数据的个数; 表格信息提取检验模块:用于接收单元格内容提取模块传输的目标表格中的数据内容,并对数据内容进行检测,计算提取内容的完整程度和准确率; 信息内容分类模块:用于接收单元格内容提取模块传输的表格内容,并对采集到的信息进行分类,并根据分类后的数据对比计算出系统的分类能力指数; 信息内容匹配模块:用于接收单元格内容提取模块传输的表格内容,并将采集到的信息与业务相关的内容进行匹配,利用TF-IDF算法结合数据余弦相似度,计算出系统的匹配能力指数; 识别能力指数计算模块:用于接收表格信息提取检验模块、信息内容分类模块以及信息内容匹配模块传输的提取内容的完整率和准确率、系统的分类能力指数以及系统的匹配能力指数,并将数据整合计算出系统的识别能力指数; 识别结果判断模块:用于接收识别能力指数计算模块传输的系统识别能力指数,并判断识别能力指数是否大于T%,若识别能力指数小于T%,则判定系统识别异常; 判断结果反馈模块:用于接收识别结果判断模块判断的结果传输至系统维护中心,若系统识别能力指数大于T%,反馈性能正常提示,若系统识别能力指数小于T%,反馈系统性能异常提示,其中T为用于和系统识别能力指数进行比对的参考值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海云钠信息科技有限公司,其通讯地址为:200120 上海市浦东新区自由贸易试验区临港新片区云汉路979号2楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励