图灵人工智能研究院(南京)有限公司杨思恩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉图灵人工智能研究院(南京)有限公司申请的专利一种基于标题增强与多模态的非结构化文档切分方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120954011B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511461262.2,技术领域涉及:G06V30/148;该发明授权一种基于标题增强与多模态的非结构化文档切分方法是由杨思恩;颜祺;王旭;蔡娜娜设计研发完成,并于2025-10-14向国家知识产权局提交的专利申请。
本一种基于标题增强与多模态的非结构化文档切分方法在说明书摘要公布了:本发明属于非结构化文档切分技术领域,涉及一种基于标题增强与多模态的非结构化文档切分方法,采用标题增强模块对文本类文档进行切分,该模块采用启发式规则引擎,结合文本形态特征、上下文语义与排版线索,对文档的候选标题进行评估,以确认标题;采用图像超分、布局检测、元素判断过程、多模态大模型以及光学字符识别模型对图像表格类文档进行切分,图像超分用于增强图像品质,布局检测用于对超分后的图像进行布局检测,根据检测结果通过元素判断过程判断文档中是否存在不便于光学字符识别模型解析的元素,以通过多模态大模型与光学字符识别模型相结合对文档进行解析,提升响应速度。
本发明授权一种基于标题增强与多模态的非结构化文档切分方法在权利要求书中公布了:1.一种基于标题增强与多模态的非结构化文档切分方法,非结构化文档包括文本类文档和图像表格类文档,其中:文本类文档还包括隐性结构文本类文档,其特征在于:所述的非结构化文档切分方法包括文本类文档切分、图像表格类文档切分,其中: 文本类文档切分,采用标题增强模块从文档中自动识别并重构潜在的层级标题结构作为语义边界依据进行文档切分;其中:标题增强模块采用启发式规则引擎,结合文本形态特征、上下文语义与排版线索,对输入的文档的候选标题进行评估,以确认标题;其中:启发式规则包括文本长度约束、文本内容约束、词性与语义约束、自定义规则约束和格式信息分析;当当前字段满足启发式规则中的全部条件时,则认为当前字段为标题; 图像表格类文档切分,包括图像超分模型、布局检测模型、多模态大模型、光学字符识别模型以及元素判断过程,其中: 图像超分模型,用于对文档中的分辨率小于指定阈值的图像进行增强处理; 布局检测模型,对经图像超分模型处理后的文档进行布局检测,以获得每页中检测到的元素及其对应的坐标; 元素判断过程,根据布局检测模型的检测结果,判断文档中是否存在不便于光学字符识别模型解析的元素:若存在,则路由至多模态大模型对元素进行信息抽取;若不存在,则直接通过光学字符识别模型进行解析;其中:所述元素包含表格、图像、公式、水印; 多模态大模型,用于对文档中的元素进行信息抽取;信息抽取的前提条件是在读取元素时,采用跨页上下文感知策略分析前一页末尾元素的布局、句法结构和语义,并与当前页开头的元素进行匹配和关联,通过无缝拼接实现逻辑上的完整性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人图灵人工智能研究院(南京)有限公司,其通讯地址为:210046 江苏省南京市栖霞区马群街道紫东路2号紫东国际创意园C21栋六楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励