中国电子科技集团公司第十研究所邓佳棋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团公司第十研究所申请的专利基于两阶段检索和大模型的规章制度智能问答方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119807346B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411778714.5,技术领域涉及:G06F16/3329;该发明授权基于两阶段检索和大模型的规章制度智能问答方法及装置是由邓佳棋;姜良重;杨旭;林家杰;陈超;田钢;杜刚;倪晓敏设计研发完成,并于2024-12-05向国家知识产权局提交的专利申请。
本基于两阶段检索和大模型的规章制度智能问答方法及装置在说明书摘要公布了:本发明公开了一种基于两阶段检索和大模型的规章制度智能问答方法及装置,属于基于规章制度文件的智能问答领域,包括步骤:基于大模型问答形式对每个文件进行文件摘要提取,构建摘要向量库;再对所有文件进行切割分块,将所有文本块采用稀疏向量模型和稠密向量模型对文本框分别向量化,构建内容向量库;第一阶段检索出与用户提问最相关的文件,采用混合检索方式对两个向量库进行检索,对两边的检索进行加权计算得到前K个最相关文件;第二阶段检索出与用户提问最相关的文本块,采用混合检索得到前k个最相关文本块;在回答时,将前k个最相关文本块作为参考文本,让大模型基于参考文本进行回答。本发明可以生成更准确的答案。
本发明授权基于两阶段检索和大模型的规章制度智能问答方法及装置在权利要求书中公布了:1.一种基于两阶段检索和大模型的规章制度智能问答方法,其特征在于,包括: S1,构造知识库:基于大模型问答形式对每个文件进行文件摘要提取,构建摘要向量库;再对所有文件进行切割分块,将所有文本块采用稀疏向量模型和稠密向量模型对文本框分别向量化,得到对应的稀疏向量和稠密向量,构建内容向量库; S2,两阶段检索:在检索时,采用两阶段检索策略,第一阶段检索出与用户提问最相关的文件,采用稀疏向量检索和稠密向量检索的混合检索方式对两个向量库进行检索,对两边的检索进行加权计算得到前K个最相关文件;第二阶段检索出与用户提问最相关的文本块,该阶段同样采用混合检索得到前k个最相关文本块; 在步骤S2中,所述在检索时,采用两阶段检索策略,第一阶段检索出与用户提问最相关的文件,采用稀疏向量检索和稠密向量检索的混合检索方式对两个向量库进行检索,对两边的检索进行加权计算得到前K个最相关文件;第二阶段检索出与用户提问最相关的文本块,该阶段同样采用混合检索得到前k个最相关文本块,具体包括子步骤: S21:采用稀疏向量模型和稠密向量模型对用户提问内容进行向量嵌入,得到问题向量集Vq={Vqs,Vqd}; S22:采用稀疏向量检索和稠密向量检索的混合检索方式,在摘要知识库和内容知识库中分别进行向量搜索,得到最k1个相关结果和最k2个相关结果;定义摘要知识库中一个文本块检索结果为Uabstract_i={Sa,Aa,Fa},其中i是结果的索引,Sa是得分,Aa是摘要内容,Fa是对应的文件名;定义内容知识库中一个文本块检索结果为Ucontent_i={St,Tt,Ft},其中i是结果的索引,St是得分,Tt是文本块内容,Ft是对应的文件名; S23:将搜索结果进行加权处理,得到最相关的文件集合; S24:第二阶段检索:在最相关文件范围内容,采用混合检索,在内容知识库中进行搜索,得到最相关文本块;在第一阶段中筛选过后的文件集合里检索与用户提问最k个相关的文本块,并且剔除得分低于设定值的结果;经过两阶段检索后,将检索到的文本块拼接起来,作为参考文本传给大模型,让大模型基于参考文本,给出用户提问的答案; S3,在回答时,将前k个最相关文本块作为参考文本,让大模型基于参考文本进行回答。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第十研究所,其通讯地址为:610000 四川省成都市金牛区茶店子东街48号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励