华南理工大学金连文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种表格数据增强方法、表格识别方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115359501B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210900596.5,技术领域涉及:G06V30/412;该发明授权一种表格数据增强方法、表格识别方法、装置及存储介质是由金连文;陈邦栋;张沛荣;张家鑫;任峪瑾设计研发完成,并于2022-07-28向国家知识产权局提交的专利申请。
本一种表格数据增强方法、表格识别方法、装置及存储介质在说明书摘要公布了:本发明公开了一种表格数据增强方法、表格识别方法、装置及存储介质,其中表格数据增强方法包括:获取表格图片数据,对表格图片数据进行标注,获得标注信息;根据所述标注信息计算并生成表格的行标识矩阵和列标识矩阵;根据生成的标识矩阵获取表格的可切割位置,根据可切割位置对表格图片进行切割;将切割出来的每个表格图片的特征进行更正,获得增强的表格图片数据。本发明可以从一张表格上获取多个表格数据,不会破坏表格本身的结构,实现高质量的数据增强,对于现存的稀缺但又难以扩充的表格数据具有重大的意义;且适用于各种类型的表格,尤其是具有跨行跨列单元格的复杂表格。本发明可广泛应用于计算机视觉领域和表格识别领域。
本发明授权一种表格数据增强方法、表格识别方法、装置及存储介质在权利要求书中公布了:1.一种表格数据增强方法,其特征在于,包括以下步骤: 获取表格图片数据,对表格图片数据进行标注,获得标注信息; 根据所述标注信息计算并生成表格的行标识矩阵和列标识矩阵; 根据生成的标识矩阵获取表格的可切割位置,根据可切割位置对表格图片进行切割; 将切割出来的每个表格图片的特征进行更正,获得增强的表格图片数据; 所述根据所述标注信息计算并生成表格的行标识矩阵和列标识矩阵,包括: 从所述标注信息中获取当前表格的总行数M和总列数N,分别建立M行N列的行标识矩阵Mr和列标识矩阵Mc; 根据单元格是否出现跨行,对行标识矩阵Mr上的每个单元进行赋值,遍历表格的所有行,获得最终的行标识矩阵Mr; 根据单元格是否出现跨列,对列标识矩阵Mc上的每个单元进行赋值,遍历表格的所有列,获得最终的列标识矩阵Mc; 所述根据单元格是否出现跨行,对行标识矩阵Mr上的每个单元进行赋值,遍历表格的所有行,获得最终的行标识矩阵Mr,包括: 对于第i行j列的单元格,如果该单元格没有跨越多行,则将该单元格在Mr中置1,即Mr[i][j]=1; 如果该单元格跨越n行,则Mr[i][j]=n,且Mr[i:i+n][j]=0,i:i+n表示区间[i,i+n,即将该单元格在Mr的该单元格所属列的第一行的位置中填入数字n,该单元格所属列的其他行填入0; 所述根据生成的标识矩阵获取表格的可切割位置,根据可切割位置对表格图片进行切割, 包括: 获取行标识矩阵Mr和列标识矩阵Mc中标识不为0的位置作为可切割位置; 在表格的行和列两个方向上,获取出所有的可切割位置,对获得的可切割位置进行组合,获得组合切割位置; 根据组合切割位置和标注信息获取图片坐标,根据图片坐标对表格图片进行切割; 所述将切割出来的每个表格图片的特征进行更正,包括: 在对行标识矩阵和列标识矩阵切割后,出现全行为0的行标识矩阵,或者全列为0的列标识矩阵; 在行标识矩阵中,删除全行为0的行,并对应地修正行标识矩阵的数值; 在列标识矩阵中,删除全列为0的列,并对应地修正列标识矩阵的数值; 根据修正获得的标识矩阵获取新的标注信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510641 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。