深源恒际科技有限公司张军委获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深源恒际科技有限公司申请的专利一种票据图像的结构化信息提取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115240178B 。
龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210729098.9,技术领域涉及:G06V20/62;该发明授权一种票据图像的结构化信息提取方法及系统是由张军委;侯进;黄贤俊设计研发完成,并于2022-06-24向国家知识产权局提交的专利申请。
本一种票据图像的结构化信息提取方法及系统在说明书摘要公布了:本发明公开了一种票据图像的结构化信息提取方法及系统,包括:对训练集中每张票据进行处理,获得票据上所有的字段内容和对应的检测框坐标;对票据的字段内容进行字段类别和字段关系的学习,将每张票据的字段内容映射为字段嵌入向量、字段内容对应的检测框坐标映射为位置嵌入向量,经融合后输入layoutLM模型中进行训练;将待测票据的字段内容和检测框坐标输入训练后的layoutLM模型中,得到每个字段预测的标签和位置信息,与所对应的真实位置信息计算交并比,筛选出不同字段间的相互关系;按预设顺序输出匹配好的文本信息。本发明能够更好地解决票据版面不固定、倾斜、透视等情况下,关键字段的分类特性和匹配关系提取。
本发明授权一种票据图像的结构化信息提取方法及系统在权利要求书中公布了:1.一种票据图像的结构化信息提取方法,其特征在于,包括: 收集预设数量的不同地区不同类型的票据; 对每张票据进行分类和四点检测并矫正,检测当前票据上的文本区域,裁剪检测框并识别文本内容,获得每张票据上所有的字段内容和对应的检测框坐标; 对每张票据的字段内容进行字段类别和字段关系的学习;其中,所述字段类别为当前字段属性,所述字段关系包括单独字段、两个一组的字段和多个一组的连续字段; 将每张票据的字段内容映射为字段嵌入向量、字段内容对应的检测框坐标映射为位置嵌入向量,并将字段嵌入向量和位置嵌入向量融合后输入layoutLM模型中; 将layoutLM模型提取的特征先连接一个全连接层预测当前字段的类别,计算交叉熵损失;而后连接另一个全连接层预测对应的位置坐标,结合对应的真值,计算SmoothL1损失和GIOU损失,结合三种损失,进行反向传播更新模型参数,直到模型收敛; 将待测票据上检测和识别到的所有的字段内容和对应的检测框坐标输入训练后的layoutLM模型中,得到每个字段预测的标签和位置信息,与所有的真实位置信息计算交并比,筛选出不同字段间的相互关系; 根据匹配关系,按预设顺序输出匹配好的文本信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深源恒际科技有限公司,其通讯地址为:100085 北京市海淀区清河西三旗东路6幢2层203室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励