浪潮通用软件有限公司宋立钦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮通用软件有限公司申请的专利确定文档中文字坐标的方法、系统、介质及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120316276B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510787109.2,技术领域涉及:G06F16/387;该发明授权确定文档中文字坐标的方法、系统、介质及计算机设备是由宋立钦;丁一凡;郑伟航;刘金桐;王雪飞设计研发完成,并于2025-06-13向国家知识产权局提交的专利申请。
本确定文档中文字坐标的方法、系统、介质及计算机设备在说明书摘要公布了:本发明属于数据处理技术领域。提供了一种确定文档中文字坐标的方法、系统、介质及计算机设备,提取源文档中每个文字的坐标,对同一页面中纵坐标一致的坐标进行合并;获取所述源文档的大模型处理结果,采用滑动窗口在所述大模型处理结果与所述源文档中同时滑动,其中,所述大模型处理结果为文字序列;计算滑动窗口内的两个文本片段的连续相同字符数,记录最大连续相同字符数及对应的匹配坐标,遍历整个所述源文档,得到所有的匹配坐标;当得到的匹配坐标存在连续时,合并连续的匹配坐标。本发明解决了大模型处理结果无法在前端标注展示的技术难题,使得能够直观地在前端对源文档审核或分析结果进行标注。
本发明授权确定文档中文字坐标的方法、系统、介质及计算机设备在权利要求书中公布了:1.一种确定文档中文字坐标的方法,其特征在于,包括以下过程: 提取源文档中每个文字的坐标,对同一页面中纵坐标一致的坐标进行合并; 获取所述源文档的大模型处理结果,采用滑动窗口在所述大模型处理结果与所述源文档中同时滑动,其中,所述大模型处理结果为文字序列; 计算滑动窗口内的两个文本片段的连续相同字符数,记录最大连续相同字符数及对应的匹配坐标,遍历整个所述源文档,得到所有的匹配坐标; 当得到的匹配坐标存在连续时,合并连续的匹配坐标,最终确定所述大模型处理结果在所述源文档中的对应坐标; 判断得到的匹配坐标是否连续,包括: 在同一页面中,当完成同一行文字的坐标合并后,得到一个坐标列表,坐标列表的每个元素对应一行文字的坐标数据,且具有唯一索引; 当得到的多个匹配坐标的索引连续、页码相同且横坐标误差在第二设定阈值范围内时,判定所述多个匹配坐标为连续的匹配坐标; 合并连续的匹配坐标,包括: 从连续的所述多个匹配坐标,取最小的文字框左上角横坐标作为合并后坐标的起始横坐标,最大的文字框右下角横坐标作为结束横坐标,最小的文字框左上角纵坐标作为起始纵坐标,最大的文字框右下角纵坐标作为结束纵坐标,保留共同的页码值,得到合并后的匹配坐标。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮通用软件有限公司,其通讯地址为:250000 山东省济南市历下区浪潮路1036号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。