Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学徐小良获国家专利权

杭州电子科技大学徐小良获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学申请的专利一种基于结构化文档的检索增强生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120067340B

龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510126899.X,技术领域涉及:G06F16/36;该发明授权一种基于结构化文档的检索增强生成方法及系统是由徐小良;王旭辉设计研发完成,并于2025-01-27向国家知识产权局提交的专利申请。

一种基于结构化文档的检索增强生成方法及系统在说明书摘要公布了:本发明提出了一种基于结构化文档的检索增强生成方法及系统,首先提取结构化文档的文档结构化信息,其次提取实体关系和它们的描述构建知识图谱,然后使用文档结构化关系增强知识图谱,再对增强知识图谱划分社区和社区摘要构建,最后进行检索增强生成。相对于现有技术,上述一种基于结构化文档的检索增强生成方法精度更高。较之于现有的方法,由于将结构化文档的结构信息整合到知识图谱中,既增加了关系数量解决了知识图谱关系稀疏的问题,又添加了结构化信息解决了知识图谱缺失结构化信息的问题,从而使构建出的社区结构更合理,信息更丰富,因此最终回答的精度更高。

本发明授权一种基于结构化文档的检索增强生成方法及系统在权利要求书中公布了:1.一种基于结构化文档的检索增强生成方法,其特征在于,包括以下步骤: 步骤1:获取结构化文档,对所述结构化文档进行识别,提取元素节点、文本节点的文字、文本节点和元素节点在文档中的位置,所述元素节点是指文档中用于组织和给具体内容分层级的基本单元,文本节点是指文档中最低内容层级下的具体文本内容; 对于提取到的元素节点,利用大语言模型构建元素节点的层次结构,作为文档结构化信息; 步骤2:根据元素节点和文本节点在文档中的位置,得到文本节点所属的最低级元素节点;将文本节点的文本按照所述大语言模型的最大Token数量进行分割,得到文本块和文本块所属的最低级元素节点,作为文本块信息; 步骤3:根据所述文本块和文本块所属的最低级元素节点,构建实体关系抽取prompt,使用所述大语言模型,识别出实体和实体的描述,以及实体之间的关系和关系的描述,最终得到实体信息和关系信息; 步骤4:根据实体信息和关系信息,将实体和关系进行对齐,然后构建知识图谱,,其中是对齐后的实体集合,其中是实体名称,是实体属性,包括实体的描述和所关联的文本块,是关系集合,,是实体和之间关系边的属性,包括关系描述; 利用步骤1得到的文档结构化信息和步骤2得到的文本块信息,增强知识图谱,得到增强知识图谱,,表示元素节点,,其中表示最低级元素节点和实体的关系,和元素节点之间的层次关系; 步骤5:对所述增强知识图谱调用社区发现算法进行社区划分,对于划分得到的每个社区,均构造总结社区摘要prompt,将总结社区摘要prompt和该社区包含的实体名称、实体的描述、关系描述拼接一同输入给大语言模型,得到社区摘要;利用embedding模型,将社区摘要向量化,得到社区摘要信息,所述社区摘要信息包括社区摘要和社区摘要embedding的映射关系; 步骤6:获取待回答的摘要型用户问题, 将所述摘要型用户问题使用所述embedding模型向量化,与社区摘要embedding进行相似度计算,筛选掉相似度低于一定阈值的社区摘要,得到若干相似度高的社区摘要;基于所述待回答的摘要型用户问题,构建用于生成中间答案和给中间答案评分的prompt,利用大语言模型对每个相似度高的社区摘要生成一个中间答案和中间答案的评分;将这些中间答案按照评分降序排序,添加到大语言模型上下文中,然后构建汇总中间答案的prompt,利用所述大语言模型返回给用户答案; 步骤1具体包括如下步骤: 步骤1.1使用版面分析模型识别所述结构化文档中的元素节点和文本节点的位置,并使用文字识别模型提取元素节点和文本节点中的文字; 步骤1.2构造识别元素节点层次结构的prompt,将元素节点按照其在文档的位置从上到下排列,一同输入给大语言模型,得到元素节点的层次结构,作为文档结构化信息,记为,其中是元素节点集合,为邻接关系集合;所述文档结构化信息存储有元素节点和其子元素节点的映射关系。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。