浩鲸云计算科技股份有限公司罗剑锋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浩鲸云计算科技股份有限公司申请的专利基于多模型协同的文档目录错误修复方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120893402B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511409007.3,技术领域涉及:G06F40/166;该发明授权基于多模型协同的文档目录错误修复方法及系统是由罗剑锋;李百成;马驰;彭洁思设计研发完成,并于2025-09-29向国家知识产权局提交的专利申请。
本基于多模型协同的文档目录错误修复方法及系统在说明书摘要公布了:本发明提供基于多模型协同的文档目录错误修复方法及系统,包括将文档构建为图结构,每个段落作为节点并提取语义、格式和位置特征;使用三层图卷积神经网络处理图结构获得融合全局信息的节点表示;筛选置信度超过阈值的节点作为候选标题;提取候选标题的文本和视觉特征;对过滤后的候选进行二分类判别,形成真实标题集合;检测标题错误并构建包含上下文的输入序列,对长文档使用自适应滑动窗口处理;生成多个候选并评分选优;匹配新旧标题;最小化格式一致性和序号连续性代价。本发明对于格式不规范或缺少明显标记的标题,也能通过其在图中的结构特征准确识别,大幅提升了标题识别的召回率和准确率。
本发明授权基于多模型协同的文档目录错误修复方法及系统在权利要求书中公布了:1.基于多模型协同的文档目录错误修复方法,其特征在于,包括以下步骤: 步骤1,将Markdown文档构建为图结构,每个段落作为节点并提取语义、格式和位置特征,节点间边权重由语义相似度和位置距离的加权组合确定;具体如下: 将待处理的Markdown文档转换为图结构表示,文档中的每个段落作为图的一个节点,为每个节点构建特征向量; 所述特征向量包括三个部分:通过预训练语言模型对段落文本编码得到的语义嵌入向量、提取段落格式信息得到的格式特征向量以及表示段落在文档中位置的位置编码向量; 在节点之间建立边连接,边的权重由两部分加权组成,第一部分为两个段落之间的语义相似度乘以可学习的权重系数,第二部分为基于段落位置距离的指数衰减函数乘以另一个可学习的权重系数,其中指数衰减函数的衰减速度由温度参数控制; 步骤2,使用三层图卷积神经网络处理图结构,各层分别采用均值聚合、注意力聚合和最大值聚合策略,获得融合全局信息的节点表示; 步骤3,结合图神经网络输出和正则表达式匹配结果,筛选置信度超过阈值的节点作为候选标题; 步骤4,提取候选标题的文本和视觉特征,通过多头交叉注意力机制融合,并基于规则集过滤; 步骤5,使用微调的大语言模型对过滤后的候选标题进行二分类判别,形成真实标题集合; 步骤6,检测标题错误并构建包含上下文的输入序列,对长文档使用自适应滑动窗口处理; 步骤7,通过序列生成模型在层级约束下修正错误标题,生成多个候选标题并评分选优; 步骤8,基于编辑距离、语义和位置相似度的加权组合匹配新旧标题,位置偏移过大时施加惩罚; 步骤9,使用动态规划算法全局优化标题序列,最小化格式一致性和序号连续性代价。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浩鲸云计算科技股份有限公司,其通讯地址为:210000 江苏省南京市雨花台区安德门大街50号B座6楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励