Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学余旭涛获国家专利权

东南大学余旭涛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利一种基于目录感知的长文档知识库构建方法及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121166839B

龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511706234.2,技术领域涉及:G06F16/31;该发明授权一种基于目录感知的长文档知识库构建方法及程序产品是由余旭涛;缪钰杰;柳志霖;王珏;龙书芹;徐进设计研发完成,并于2025-11-20向国家知识产权局提交的专利申请。

一种基于目录感知的长文档知识库构建方法及程序产品在说明书摘要公布了:本发明公开了一种基于目录感知的长文档知识库构建方法及程序产品,属于人工智能与自然语言处理领域。该方案通过将原始长文档依次进行预处理、目录结构解析、混合分块、双标签生成、标签智能优化、向量化与元信息挂载,最终实现知识库的自动化构建与高质量检索增强生成。本发明充分利用目录结构感知能力保障语义完整性,结合双标签体系与智能优化循环提升标签质量与检索效能,显著提高了知识库的构建效率、检索准确性及结果可追溯性,适用于学术专著、技术文档、政策法规等长篇复杂结构文档的智能化处理与应用。

本发明授权一种基于目录感知的长文档知识库构建方法及程序产品在权利要求书中公布了:1.一种基于目录感知的长文档知识库构建方法,其特征在于,包括如下步骤: 1获取若干原始长文档,并将所有原始长文档转换为统一编码处理以及剔除无价值信息的标准化文本,形成标准化文本集合; 2对于每个标准化文本,提取出文本中的章节标题,并将每个章节标题、所在位置和所在层级作为一个章节标题节点,将所有章节标题节点按照章节标题所在层级生成一个章节树; 3对于每个标准化文本,以章节树的章节标题节点位置作为内容边界,拆分为若干内容块,每个内容块包括章节标题对应的正文内容、起始位置和所在层级; 4基于每个内容块的正文内容,提取主题标签与用途类型标签,所述主题标签用于表征对应内容块的主题类型,所述用途类型标签用于表征对应内容块的用途属性; 5对所有标签进行量化评分,并将低于阈值的标签进行规则化优化,直至所有标签的评分高于阈值; 6将每个内容块的正文内容与优化后的主题标签与用途类型标签组合为一个语义单元,并从语义单元中提取出高维语义向量,将高维语义向量与对应的元信息组成一个知识单元,存入知识库;其中,所述元信息包括对应内容块的章节标题、所在层级、起始位置、主题标签、用途类型标签、标准化文本编号、标准化文本路径和时间戳; 步骤4具体包括: 4.1将每个内容块的正文内容输入预训练的第一嵌入模型,提取出主题语义向量,其中,所述第一嵌入模型用于根据输入文本提取出用于主题识别的语义向量; 4.2将主题语义向量输入预训练的关键词提取模型中,从而从预设主题词集合中提取出若干与主题语义向量有关的候选主题词,其中,所述关键词提取模型用于从预设主题词集合中提取出若干与主题语义向量有关的候选主题词; 4.3对所有候选主题词进行主题聚类,选取前若干个候选主题词作为当前内容块的主题标签; 4.4将每个内容块的正文内容输入预训练的第二嵌入模型,提取出用途语义向量,其中,所述第二嵌入模型用于根据输入文本提取出用途属性的语义向量; 4.5将用途语义向量输入预训练的类型分类器中,提取用途类型标签,其中,所述类型分类器用于从用途语义向量中匹配出所属的一个或多个用途类型以及置信度; 4.6若用途类型标签数量大于阈值,则提取前若干个置信度最大的用途类型标签作为当前内容块的用途类型标签; 4.7将主题标签与用途类型标签添加到每个内容块中。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。