欣诚信息技术有限公司师国华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉欣诚信息技术有限公司申请的专利一种基于父子分段与多源召回的增强检索生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120723894B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511141830.0,技术领域涉及:G06F16/334;该发明授权一种基于父子分段与多源召回的增强检索生成方法是由师国华;田蕾;董浩然;刘迎;杜少朋;张天锋;王统兵设计研发完成,并于2025-08-15向国家知识产权局提交的专利申请。
本一种基于父子分段与多源召回的增强检索生成方法在说明书摘要公布了:本发明提供了一种基于父子分段与多源召回的增强检索生成方法,部署于包含父段库、子段向量子库、召回器和生成器的系统中,原始文档集经文档分段器切分为父段和子段,子段向量存储于子段向量子库,方法流程为:获取用户查询向量,判断是否触发第一召回条件,若触发则通过第一召回通道在子段向量子库中检索匹配的子段向量,获取对应父段标识符并定位父段,执行父子分段展开得到展开子段集合,输入生成器生成答案片段,最后基于融合策略将答案片段写入答案缓冲区。本发明可以提高检索生成答案的准确性、完整性和语义一致性。
本发明授权一种基于父子分段与多源召回的增强检索生成方法在权利要求书中公布了:1.一种基于父子分段与多源召回的增强检索生成方法,所述方法部署于增强检索生成系统,所述增强检索生成系统包括存储有原始文档集的父段库、存储有子段向量子库的节点索引器、部署有源召回通道的召回器、以及用于生成答案的生成器,所述原始文档集通过文档分段器被切分为多个父段,每个父段被进一步切分为多个子段,所述节点索引器对每个子段执行向量化并得到子段向量,其特征在于,所述增强检索生成方法包括: 获取用户输入的查询向量,基于所述查询向量判断是否触发第一召回条件,若是,则激活第一召回通道; 通过所述第一召回通道在子段向量子库中检索与所述查询向量匹配的至少一个第一子段向量; 基于所述第一子段向量获取对应的父段标识符; 根据所述父段标识符定位对应的父段,并基于所述父段执行父子分段展开得到展开子段集合; 将所述展开子段集合输入所述生成器并生成第一答案片段; 基于第一融合策略将所述第一答案片段写入答案缓冲区; 在基于第一融合策略将所述第一答案片段写入答案缓冲区之后,还包括: 基于答案缓冲区中已存答案片段调用实体覆盖检测器,得到未覆盖实体集合; 基于所述未覆盖实体集合的元素数量与第一数量阈值的比较结果,若大于所述第一数量阈值,则激活第二召回通道; 通过所述第二召回通道在父段库中执行语义互补检索,得到至少一个第二父段; 基于所述第二父段调用子段切分器执行二次切分,得到第二子段集合; 将所述第二子段集合输入生成器并生成第二答案片段; 基于第二融合策略将所述第二答案片段与已存答案片段进行段落级对齐与冗余消除后,合并至答案缓冲区;其中,第二召回通道采用基于父段库的语义检索算法,结合未覆盖实体集合中的关键词进行语义扩展,检索与原始查询语义互补的父段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人欣诚信息技术有限公司,其通讯地址为:050035 河北省石家庄市高新区湘江道319号长江道壹号A座1709室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励