科大讯飞股份有限公司殷兵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司申请的专利文档识别方法及智能交互方法和相关装置、设备、介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119990112B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510454667.7,技术领域涉及:G06F40/258;该发明授权文档识别方法及智能交互方法和相关装置、设备、介质是由殷兵;陶柘;张志勇;蒋兵兵;龙明康设计研发完成,并于2025-04-11向国家知识产权局提交的专利申请。
本文档识别方法及智能交互方法和相关装置、设备、介质在说明书摘要公布了:本申请公开了一种文档识别方法及智能交互方法和相关装置、设备、介质,其中,文档识别方法包括:基于待识别文档进行识别,得到待识别文档中版面元素和版面元素的识别结果;基于标题的识别结果进行分析,得到第一标题序列;修正第一标题序列的标题层级,得到第二标题序列;基于第二标题序列进行验证,得到验证结果;其中,验证结果表征第二标题序列是否无误;响应于验证结果表征第二标题序列有误,选择第二标题序列,作为新的第一标题序列,并返回修正第一标题序列的标题层级,得到第二标题序列的步骤进行迭代,直至满足结束条件为止。上述方案,能够提升文档识别时标题建模的连贯性,以区分文档内各个标题的层级关系,特别是在跨页场景下。
本发明授权文档识别方法及智能交互方法和相关装置、设备、介质在权利要求书中公布了:1.一种文档识别方法,其特征在于,包括: 基于待识别文档进行识别,得到所述待识别文档中版面元素和所述版面元素的识别结果;其中,所述版面元素至少包含标题; 基于所述标题的识别结果进行分析,得到第一标题序列; 修正所述第一标题序列的标题层级,得到第二标题序列; 基于所述第二标题序列进行验证,得到验证结果;其中,所述验证结果表征所述第二标题序列是否无误; 响应于所述验证结果表征所述第二标题序列有误,选择所述第二标题序列,作为新的第一标题序列,并返回所述修正所述第一标题序列的标题层级,得到第二标题序列的步骤进行迭代,直至满足结束条件为止; 其中,所述修正所述第一标题序列的标题层级,得到第二标题序列之前,所述方法还包括: 以样本标题序列所标注的标注信息为训练目标,基于所述样本标题序列训练得到序列校核模型;其中,所述样本标题序列至少包括错误标题序列,且所述标注信息至少包括所述错误标题序列的修改方式; 所述修正所述第一标题序列的标题层级,得到第二标题序列,包括: 基于所述序列校核模型修正所述第一标题序列的标题层级,得到所述第二标题序列; 所述基于所述第二标题序列进行验证,得到验证结果,包括: 基于所述序列校核模型对所述第二标题序列进行验证,得到表征所述第二标题序列是否有误的预测标记作为所述验证结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新开发区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。