上海掌数科技有限公司林宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海掌数科技有限公司申请的专利一种基于OCR技术的图片文件智能分拣方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115495410B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211118826.9,技术领域涉及:G06F16/11;该发明授权一种基于OCR技术的图片文件智能分拣方法是由林宇;林超;高星;江成设计研发完成,并于2022-09-13向国家知识产权局提交的专利申请。
本一种基于OCR技术的图片文件智能分拣方法在说明书摘要公布了:本发明提供一种基于OCR技术的图片文件智能分拣方法,包括以下步骤:设定办理业务所需的文件类别集合,对文件类别集合中各文件的类别进行编号和管理;对文件类别集合按编号预先给每一类别的文件建立标准匹配模板作为该类别的标准文件,使用标准文件定义该类别文件的内容和边界;上传测试文件,根据标准文件的类别定义,采用OCR文字识别和比对算法对测试文件进行分拣分类,输出分拣分类结果。本发明仅需提供一张标准文件作为模板,减少了用户使用成本,达到较高分拣准确率,兼顾可拓展性、可解释性、多场景鲁棒性;大幅减轻人工工作量,提升客户业务体验;核心算法流程可解释强,定制性强,可扩展到各个行业基于文字识别技术的智能分拣场景。
本发明授权一种基于OCR技术的图片文件智能分拣方法在权利要求书中公布了:1.一种基于OCR技术的图片文件智能分拣方法,其特征在于,包括以下步骤: S1、设定办理业务所需的文件类别集合,对所述文件类别集合中各文件的类别进行编号和管理; S2、对所述文件类别集合按编号预先给每一类别的文件建立标准匹配模板作为该类别的标准文件,使用所述标准文件定义该类别文件的内容和边界; S3、上传测试文件,根据所述标准文件的内容和边界,采用OCR文字识别和比对算法对所述测试文件进行分拣分类,输出分拣分类结果; 所述S2步骤的建立标准匹配模板的方法包括: S21、将业务所需分类的n个文件集合定义为A{a0,a1,a2,a3…an},将集合A中所有的文件进行OCR文字识别,并保存每个文件所识别到的文字的字段及对应的位置; 所述对应的位置表示为:字段左上,右上,左下,右下四个点组成的最小包围矩形; S22、根据集合A中所有字段的位置,按照从上至下、从左到右排序,删除标点和特殊符号,删除长度小于2的字段; S23、统计每个字段在集合A中出现的次数,得到该字段的词频C; S24、计算每个文件的识别分S,计算公式为: S=1C21 式1中,S代表该份文件的可识别程度; S25、计算每个文件的每个识别到的字段的左上点和该文件其他所有字段的左上点的方向单位向量,所有所述方向单位向量的集合表示该文件的结构M; 通过所述词频C、识别分S、结构M,以及集合A中的文字的字段及对应的位置,共同组成业务的标准匹配模板; 所述S2步骤的建立标准匹配模板的方法还包括: 对于无法提供业务的标准匹配模板的文件,针对特殊文件根据具体情况设计特殊的模板逻辑,建立特殊匹配模板规则,定义文件的内容和边界; 所述S3步骤的上传测试文件的方法包括: S311、将测试文件t进行OCR文字识别,得到文字的字段和对应位置; S312、根据文字的长宽比,判定测试文件是否有±90°旋转,若有,转正图片;若没有,进入S33步骤; S313、将字段的内容以图片的形式送入文字判别神经网络,判断字段的图片是否有180°的旋转,若有,转正图片;若没有,进入S34步骤; S314、根据字段的位置信息,判断字段的图片是否有小角度倾斜,若有,修正倾斜,直至得到正向的测试文件t*; 所述S3步骤的对所述测试文件进行分拣分类的方法包括: S321、根据测试文件t*的每个字段的位置,从上至下、从左到右排序,删除标点和特殊符号; S322、计算每个字段与集合A中所有字段的Levenshtein距离,若Levenshtein距离大于等于字段长度的20%,则认为该字段和集合A中对应字段不为同一字段; 若Levenshtein距离小于字段长度20%,则认为该字段和集合A中对应字段为同一字段,并记录匹配关系P{p0,p1,p2…pn}; S323、根据字段匹配结果,计算集合A中每个文件与测试文件t*的文件匹配分数San,其计算公式为: ,p∈P,2 式2中,Cp是匹配关系p对应字段的词频,P是匹配关系对的集合,p是匹配关系对; 若测试文件t*与集合A中的文件匹配分数小于等于阈值,则认为该测试文件t*不通过文字比对; 若测试文件t*与集合A中的文件匹配分数大于阈值,则认为该测试文件t*通过文字比对; S324、将所有通过文字比对的测试文件t*进行结构比对,将两者是向量结构M直接相减,得到结构误差,若结构误差高于等于阈值,则认为该测试文件t*不通过结构比对; 若结构误差低于阈值,则认为该测试文件t*通过结构比对; S325、将通过文字和结构比对的测试文件t*进行识别分的分数排序,排名第一的为分拣分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海掌数科技有限公司,其通讯地址为:200093 上海市杨浦区周家嘴路3388号13号楼C01-C04;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励