西安电子科技大学李青山获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利一种基于开源Paddle框架的PDF文档识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116740723B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310549326.9,技术领域涉及:G06V30/148;该发明授权一种基于开源Paddle框架的PDF文档识别方法是由李青山;褚华;李佳楠;杨文勇设计研发完成,并于2023-05-16向国家知识产权局提交的专利申请。
本一种基于开源Paddle框架的PDF文档识别方法在说明书摘要公布了:本发明公开了一种基于开源Paddle框架的PDF文档识别方法,包括:获取待识别PDF文档;通过PaddleOCR框架的预训练的文本检测模型和预训练的文字识别模型,以及OpenCV的形态学操作和投影分割,检测出PDF文档中每页的文本块,得到PDF文档的文本块列表;通过PaddleOCR框架的预训练的版面分析模型,识别PDF文档中每页的文本区域的类别,得到PDF文档的文本区域列表;根据文本块列表和文本区域列表,确定PDF文档的OCR识别文本;基于文本区域列表和字符提取工具,确定PDF文档的PDF识别文本;根据OCR识别文本和PDF识别文本生成对比文件;对比文件用于描述OCR识别文本和PDF识别文本之间的不同部分。本发明提高了文本检测的准确性、高效性和可靠性。
本发明授权一种基于开源Paddle框架的PDF文档识别方法在权利要求书中公布了:1.一种基于开源Paddle框架的PDF文档识别方法,其特征在于,包括: 获取待识别PDF文档; 通过PaddleOCR框架的预训练的文本检测模型和预训练的文字识别模型,以及OpenCV的形态学操作和投影分割,检测出所述PDF文档中每页的文本块,得到所述PDF文档的文本块列表; 通过PaddleOCR框架的预训练的版面分析模型,识别所述PDF文档中每页的文本区域的类别,得到所述PDF文档的文本区域列表; 根据所述文本块列表和所述文本区域列表,确定所述PDF文档的OCR识别文本; 基于所述文本区域列表和字符提取工具,确定所述PDF文档的PDF识别文本; 根据所述OCR识别文本和所述PDF识别文本生成对比文件;所述对比文件用于描述所述OCR识别文本和所述PDF识别文本之间的不同部分; 其中,所述通过PaddleOCR框架的预训练的文本检测模型和预训练的文字识别模型,以及OpenCV的形态学操作和投影分割,检测出所述PDF文档中每页的文本块,得到所述PDF文档的文本块列表,包括: 将所述PDF文档转换为图片,并对每张图片进行预处理; 通过PaddleOCR框架的预训练的文本检测模型,检测出每张预处理后的图片中的文本块,得到第一文本块和第一文本块信息;所述第一文本块信息为第一文本块的坐标; 通过OpenCV的形态学操作和投影分割,检测出每张预处理后的图片中的文本块,得到第二文本块和第二文本块信息;所述第二文本块信息为第二文本块的坐标; 通过PaddleOCR框架的预训练的文字识别模型对每个第一文本块和每个第二文本块分别进行文本识别,得到识别结果;第一文本块的所述识别结果为第一文本块中包含的字符和第一文本块的置信度,第二文本块的所述识别结果为第二文本块中包含的字符和第二文本块的置信度; 对于每张预处理后的图片,确定该张图片中每个第一文本块的坐标与该张图片中每个第二文本块的坐标之间的差值;所述差值为纵坐标之间的差值; 对于该张图片中的第一个第一文本块,判断该张图片中的所有第二文本块中是否存在纵坐标与所述第一个第一文本块的纵坐标之间的差值小于预设阈值的目标第二文本块,若存在,则将所述第一个第一文本块与所述目标第二文本块中置信度高的一个文本块,作为该张图片中的一个目标文本块,并得到该张图片中剩余的第二文本块;若不存在,则将所述第一个第一文本块作为该张图片中的一个目标文本块,并得到该张图片中剩余的第二文本块; 对于该张图片中的第二个第一文本块,判断该张图片中剩余的第二文本块中是否存在纵坐标与所述第二个第一文本块的纵坐标之间的差值小于所述预设阈值的目标第二文本块,若存在,则将所述第二个第一文本块和所述目标第二文本块中置信度高的一个文本块,作为该张图片中的一个目标文本块,得到更新后的该张图片中剩余的第二文本块;若不存在,则将所述第二个第一文本块作为该张图片中的一个目标文本块,得到更新后的该张图片中剩余的第二文本块,如此,对该张图片中的各个第一文本块依次处理,直至完成对该张图片中的最后一个第一文本块的处理时,得到该张图片中的所有目标文本块; 对于每个目标文本块,将该目标文本块的坐标和该目标文本块中包含的字符,作为该目标文本块的目标文本块总信息;其中,各张预处理后的图片中的目标文本块总信息构成所述PDF文档的文本块列表。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励