北京中科闻歌科技股份有限公司郝艳妮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京中科闻歌科技股份有限公司申请的专利一种多模态文档解析方法、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121303107B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511423460.X,技术领域涉及:G06F40/205;该发明授权一种多模态文档解析方法、电子设备和存储介质是由郝艳妮;李彤;柳力多;曹家;罗引;王磊设计研发完成,并于2025-09-30向国家知识产权局提交的专利申请。
本一种多模态文档解析方法、电子设备和存储介质在说明书摘要公布了:本发明提供了一种多模态文档解析方法、电子设备和存储介质,方法包括:对原始文档预处理,用目标检测模型识别关键元素至少含公式、表格、文本、图像,得元素定位标注表;基于标注表粗识别任务类型得标识,结合原始文档元数据识别领域,生成领域适配参数;依标注表定元素范围,结合任务标识分层检测障碍并针对性修复,得无障碍元素文档;对无障碍元素协同编码,基于任务标识与编码结果拆分子任务并行处理,调用适配参数调精度;校验修正处理结果,按适配参数格式整合为最终结构化文档报告。本发明能够提升多模态文档解析效率与精度。
本发明授权一种多模态文档解析方法、电子设备和存储介质在权利要求书中公布了:1.一种多模态文档解析方法,其特征在于,所述方法包括如下步骤: S100,对原始文档执行预处理操作以生成预处理后文档,采用目标检测模型对所述预处理后文档中的全部关键元素进行识别,得到元素定位标注表;所述关键元素至少包括公式、表格、文本及图像,所述元素定位标注表包含各关键元素对应的元素ID、坐标信息及初步类型; S200,基于所述元素定位标注表进行任务类型粗识别,根据粗识别结果确定原始文档的任务类型标识;基于原始文档的元数据识别原始文档所属领域,结合所述任务类型标识及所属领域生成领域适配参数; S300,依据所述元素定位标注表确定各关键元素的区域范围,结合所述任务类型标识执行分层障碍检测,得到所有关键元素的障碍类型;调用与所述障碍类型对应的修复逻辑进行针对性处理,生成保留各元素与原始文档坐标关联关系的无障碍元素文档; S400,对所述无障碍元素文档中的全部关键元素进行协同编码以生成协同编码结果;基于所述任务类型标识及协同编码结果生成任务令牌,根据所述任务令牌拆分具体子任务并进行并行处理,处理过程中调用所述领域适配参数调整处理精度,生成多任务并行处理结果集; S500,对所述多任务并行处理结果集执行多维度校验修正,按照所述领域适配参数中的格式要求对校验修正后的结果进行整合,形成最终结构化文档报告; 所述结合所述任务类型标识及所属领域生成领域适配参数,具体包括: 根据识别的所属领域,从预构建的领域参数模板库中调用对应领域的初始参数模板; 根据所述任务类型标识对初始参数模板进行定向调整,得到调整后的领域参数矩阵初始权重:若为公式处理任务类型标识,则调整领域参数矩阵中与公式符号相关的特征维度权重,并调整知识继承权重以侧重领域通用模型的公式语法解析参数;若为表格处理任务类型标识,则调整领域参数矩阵中与表格结构相关的特征维度权重,并根据表格数据的核心需求调整精度阈值; 根据所属领域的常见程度调整元学习微调所需样本数量:常见领域所需样本数量设为第一预设值,冷门或稀缺领域则调整为第二预设值,同时将对应领域的专属知识图谱补充至领域知识增强子参数中; 将调整后的领域参数矩阵初始权重、元学习微调样本需求、精度阈值、格式规则及知识融合参数整合为完整的领域适配参数文件。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科闻歌科技股份有限公司,其通讯地址为:100080 北京市海淀区北四环西路9号楼7层717室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励