图观(天津)数字科技有限公司李颖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉图观(天津)数字科技有限公司申请的专利一种基于大模型的文档识别与校核方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120975100B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511503346.8,技术领域涉及:G06F40/30;该发明授权一种基于大模型的文档识别与校核方法及装置是由李颖;庞海杰;李亦枫;李元;李春辉;黄沐鸿;张树庭;魏梦婷设计研发完成,并于2025-10-21向国家知识产权局提交的专利申请。
本一种基于大模型的文档识别与校核方法及装置在说明书摘要公布了:本发明提供了一种基于大模型的文档识别与校核方法及装置,方法包括获取待识别的文档,将所述文档转换成图片格式,将得到的文档图片输入到预训练的视觉大模型中,输出识别到的信息;将所述视觉大模型识别到的信息输入到语言大模型中,通过提示词工程撰写需要提取的字段信息,引导语言大模型对输入信息进行关键词提取,将所需提取的字段信息以结构化的方式输出;配置校核规则,包括构建校核脚本以及校核规则知识库;将输出的数据输入到校核大模型中,校核大模型结合RAG检索增强生成技术构建动态双引擎检索机制,对输入的信息进行校核;生成校核结果,并进行可视化展示。本发明能够提高各类文档识别的准确率和鲁棒性。
本发明授权一种基于大模型的文档识别与校核方法及装置在权利要求书中公布了:1.一种基于大模型的文档识别与校核方法,其特征在于:包括如下步骤: 步骤1:获取待识别的文档,将所述文档转换成图片格式; 步骤2:将得到的文档图片输入到预训练的视觉大模型中,输出识别到的信息;具体包括: 收集文档图像数据集,对多类型文档图像数据进行图像转换,去除歪斜、模糊文档图像数据; 标注收集到的文档图像,对文本区域、表格单元、公式区块元素进行多边形标注,并且将需要提取的字段信息进行标注,将标注结果构建为数据集,并通过自定义脚本生成训练集、验证集、以及测试集; 将标注好的文档图像数据传入所述视觉大模型中,调整损失函数; 将识别结果进行多模态融合,以结构化数据的形式输出识别结果,包括图片中的文字内容、文字位置、段落结构、表格信息以及对应的识别框坐标信息; 步骤3:将所述视觉大模型识别到的信息输入到语言大模型中,通过提示词工程撰写需要提取的字段信息,引导所述语言大模型对输入信息进行关键词提取,将所需提取的字段信息以结构化的方式输出; 步骤4:配置校核规则,包括构建校核脚本以及校核规则知识库;将通用校核规则与行业专属规范存储于所述校核规则知识库;具体包括: 配置专业规则引擎,作为规则执行与调度的核心载体; 通过自然语言设计提示词模板,包含任务描述、知识引用、约束条件、输出格式四大模块,明确校核目标与要求; 步骤5:将所述步骤3和所述步骤4输出的数据输入到校核大模型中,所述校核大模型结合RAG检索增强生成技术构建动态双引擎检索机制,对输入的数据进行校核;具体包括: 所述校核大模型结合RAG检索增强生成技术构建动态双引擎检索机制,对输入的信息进行校核包括: 对结构化数据进行语义相似度计算,从所述校核规则知识库中召回匹配度最高的基础校核规则; 通过关键词提取与规则模板匹配,触发规则引起从所述校核脚本中筛选业务专属校验逻辑; 在模型推理阶段,所述校核大模型融合业务系统数据、召回的基础校核规则、业务专属校验逻辑及待校核数据进行推理,从多个维度进行深度校验; 步骤6:生成校核结果,并进行可视化展示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人图观(天津)数字科技有限公司,其通讯地址为:300480 天津市滨海新区中新天津生态城动漫中路482号创智大厦第[2]层办公室[253]房间;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励