腾讯科技(深圳)有限公司赵志勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯科技(深圳)有限公司申请的专利文档识别方法、装置、电子设备和计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115131804B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210425659.6,技术领域涉及:G06V30/413;该发明授权文档识别方法、装置、电子设备和计算机可读存储介质是由赵志勇设计研发完成,并于2022-04-21向国家知识产权局提交的专利申请。
本文档识别方法、装置、电子设备和计算机可读存储介质在说明书摘要公布了:本发明实施例公开了一种文档识别方法、装置、电子设备和计算机可读存储介质;本发明实施例在显示文档识别页面后,响应于针对文档识别页面中的识别控件的触发操作,在文档识别页面中的待识别文档图像中提取出版面结构特征和版面内容特征,然后,根据版面结构特征和版面内容特征,在待识别文档图像中检测出至少一个版面内容区域和版面内容区域的内容类型,在待识别文档图像中识别出版面内容区域对应的文本内容,并基于文本内容和内容类型,确定版面内容区域的版面内容,然后,根据版面内容,生成待识别文档图像对应的目标文档,并展示目标文档,该目标文档为可编辑文档;该方案可以提升文档识别的准确性。
本发明授权文档识别方法、装置、电子设备和计算机可读存储介质在权利要求书中公布了:1.一种文档识别方法,其特征在于,包括: 显示文档识别页面,所述文档识别页面包括待识别文档图像和识别控件; 响应于针对所述识别控件的触发操作,对所述待识别文档图像进行版面矫正,得到矫正后文档图像; 对所述矫正后文档图像的图像尺寸进行调整,得到调整后文档图像; 采用训练后版面检测模型在所述调整后文档图像中提取出版面结构特征和版面内容特征,所述训练后版面检测模型为将scaled-yolov4中的主干网络替换为CBNetV2的主干网络得到; 根据所述版面结构特征,在所述待识别文档图像中检测出至少一个版面结构区域和所述版面结构区域对应的区域类型; 根据所述区域类型,确定所述版面结构区域的版面结构类型; 当所述版面结构类型为分栏结构区域时,基于所述版面内容特征,在所述版面结构区域中识别出至少一个版面内容区域和所述版面内容区域的初始内容类型,其中,所述分栏结构区域为待识别文档图像包含的文档中用于进行内容分栏的区域; 当所述初始内容类型为公式时,获取所述公式对应的版面内容区域的公式位置信息和公式格式信息,并根据所述公式位置信息和公式格式信息,确定所述公式的公式类型,得到所述版面内容区域的内容类型,所述公式类型包括行内公式和行间公式,所述行内公式为在文本段落中的公式,所述行间公式为在所述文本段落之间的公式; 在所述待识别文档图像中识别出所述版面内容区域对应的文本内容,并基于所述文本内容和内容类型,确定所述版面内容区域的版面内容; 根据所述版面内容,生成所述待识别文档图像对应的目标文档,并展示所述目标文档,所述目标文档为可编辑文档。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(深圳)有限公司,其通讯地址为:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。