北京鸿鹄云图科技股份有限公司何小敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京鸿鹄云图科技股份有限公司申请的专利基于图像识别的PDF文档结构化加载方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120181041B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510608694.5,技术领域涉及:G06F40/151;该发明授权基于图像识别的PDF文档结构化加载方法是由何小敏;郑俐;赵晓;刘从清;贾若;刘可华设计研发完成,并于2025-05-13向国家知识产权局提交的专利申请。
本基于图像识别的PDF文档结构化加载方法在说明书摘要公布了:本申请提供了基于图像识别的PDF文档结构化加载方法,涉及图像数据处理技术领域,包括:基于PDF文档的边距信息设置文档图像的预定提取尺度;以预定提取尺度中的预定粗尺度获取PDF文档的初始图像;引入预处理策略对初始图像进行处理,得到目标图像;多维收集目标图像的目标特征参数集,并激活加载引擎分类器对目标特征参数集进行分析,确定目标引擎类别;通过目标引擎类别对初始图像进行结构化加载。本申请解决了现有技术由于无法根据PDF文档中图像的语义特征和布局形式自适应选择加载引擎,导致图像型PDF结构还原效果差的技术问题,达到了提升复杂PDF文档结构重建准确性与数据加载质量的技术效果。
本发明授权基于图像识别的PDF文档结构化加载方法在权利要求书中公布了:1.基于图像识别的PDF文档结构化加载方法,其特征在于,包括: 基于PDF文档的边距信息设置文档图像的预定提取尺度; 以所述预定提取尺度中的预定粗尺度获取所述PDF文档的初始图像; 引入预处理策略对所述初始图像进行处理,得到目标图像; 多维收集所述目标图像的目标特征参数集,并激活加载引擎分类器对所述目标特征参数集进行分析,确定目标引擎类别; 通过所述目标引擎类别对所述初始图像进行结构化加载; 其中,引入预处理策略对所述初始图像进行处理,得到目标图像,包括: 根据所述预处理策略对所述初始图像进行高斯模糊处理,得到模糊图像; 根据所述预处理策略对所述模糊图像进行晶格化处理,得到晶格模糊图像; 将所述晶格模糊图像作为所述目标图像; 激活加载引擎分类器对所述目标特征参数集进行分析,确定目标引擎类别,包括: 通过所述加载引擎分类器对所述目标特征参数集进行分析得到所述初始图像的所述目标引擎类别; 其中,所述加载引擎分类器包括第一分类器和第二分类器; 其中,所述第一分类器为对第一训练数据组进行监督训练得到的支持向量机,所述第一训练数据组包括第一训练图像的训练颜色特征参数、训练纹理特征参数及所述第一训练图像是否符合图片约束的标识; 其中,所述第二分类器为对第二训练数据组进行监督训练得到的支持向量机,所述第二训练数据组包括第二训练图像的训练位置特征参数及所述第二训练图像是否符合距离差约束的标识,且所述第二训练图像具备不符合所述图片约束的图像; 所述第二训练数据组,包括: 随机提取所述第二训练图像中的第一晶格位置、第二晶格位置,并组成训练晶格对; 计算所述训练晶格对的训练晶格距离,并判断所述训练晶格距离是否符合所述距离差约束。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京鸿鹄云图科技股份有限公司,其通讯地址为:100080 北京市海淀区东北旺西路8号院中关村软件园23号孵化器楼405室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。