Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安煤科透明地质科技有限公司陈长远获国家专利权

西安煤科透明地质科技有限公司陈长远获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安煤科透明地质科技有限公司申请的专利一种图文混合输出的大模型RAG检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120763309B

龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511142513.0,技术领域涉及:G06F16/3331;该发明授权一种图文混合输出的大模型RAG检索方法及系统是由陈长远;刘再斌;范涛;李贵红;刘博睿;荆小恬;杜易明;李西萍;刘强;赵佳文;李旭设计研发完成,并于2025-08-15向国家知识产权局提交的专利申请。

一种图文混合输出的大模型RAG检索方法及系统在说明书摘要公布了:本发明属于人工智能大模型技术领域,公开了一种图文混合输出的大模型RAG检索方法及系统。该方法对原始文档语料进行预处理,生成语料树,并对图、表等语料进行处理,生成键值对存储到数据库中;对问答语句生成词向量,并与语料树进行检索,找到最相关的语料;将最相关的语料拼接成prompt,然后传送给文本大语音模型;问答大模型输出相关结果;基于文本大语音模型输出的结果,检索替换结果中的图、表的键信息,生成最终的问答结果。本发明解决了现有技术难以处理这种包含文本、图片、图表数据的资料的问题,生成了准确度高的最终的问答结果。

本发明授权一种图文混合输出的大模型RAG检索方法及系统在权利要求书中公布了:1.一种图文混合输出的大模型RAG检索方法,其特征在于,该方法包括以下步骤: S1,对原始文档语料进行预处理,生成语料树,并对图、表语料进行处理,生成键值对,存储到数据库中; S2,对问答语句生成词向量,并与语料树进行检索,找到相关系数最高的语料; S3,将最相关的语料拼接成提示词prompt,传送给文本大语言模型; S4,文本大模型输出相关结果; S5,基于文本大语言模型输出的结果,检索替换结果中的图、表键信息,生成最终的问答结果; 步骤S2中,并与语料树进行检索中包括将生成词向量的问答语句进行RAG检索,具体步骤为: S201,RAG包括Retriever和Generator,Retriever用于定位到相应的文档,Generator用于生成相应的答案; S202,在语料树中进行词向量检索;如果根节点没有与检索词的词向量相等的词向量,则继续遍历子节点,如果所有的子节点都不包含检索词的词向量,此语料与检索词没有关系,则依次处理剩余语料;如果所有的语料均与检索词没有任何关系,则直接跳到步骤S3;如果语料树中的内容包含有检索词的词向量,则依次遍历所有的节点,找出相关性最高的语料;首先比较根节点,如果检索词的词向量与根节点的词向量匹配度高,则将跟节点与其的所有子节点均提取出来,留待步骤S3使用;如果匹配度低,则继续遍历其子节点;计算词向量匹配度的公式如下: ; 式中,分别为两个待比较的向量,为余弦相似度,为向量的模; S203,对步骤S202检索到的语料词向量段根据相关性高低进行排序,依次取个相关性最高的词向量段,为设置值,表示检索到的最相关的语料的数目;然后将词向量还原为相应的文本语料,生成最终的检索结果; 在步骤S202中,检索词的词向量与根节点的词向量匹配度的计算方法包括: S2021、定义有四个词向量; S2022、若根节点词向量数目小于四,则直接进行递归操作;若根节点的词向量的数目大于等于四,则利用改进的高斯混合聚类算法进行聚类,得到最终的四个聚类词向量; S2023、若检索词的词向量小于根节点向量的个数,则计算检索词的词向量属于步骤S2022得到的哪个高斯分布;高斯分布为: ; 式中,为最大值,为高斯分布函数的系数,为高斯混合分布函数;个高斯分布的数量,为从1到个高斯分布的数量,为取最大值; S2024、依次计算得到最大的个,相加得到检索词向量与语料词向量的相关性值,表达式为: ; 式中,为相关性的累加值; 在步骤S2022中,改进的高斯混合聚类算法包括: S20221、要聚类为个高斯分布,设置如下的高斯分布函数: ; 式中,为高斯混合分布,为高斯分布函数,为高斯分布的参数,,为均值,为方差;为高斯分布的类别,取值为0到; 高斯分布函数的表达式为: ; S20222、改进的高斯混合聚类的似然函数为: ; 式中,为似然函数,为样本的数量,均为超参数系数,为权重正则化项,为高斯混合分布中的第个高斯成分的概率分布,为散度计算; 散度计算的表达式为: ; 式中,为KL散度的计算公式,计算的是分布与的散度; 设置初始值,其中,为系数,取值为实数,为个高斯分布函数的均值,分别为个高斯分布函数的方差; S20223、计算: ; 式中,为比例系数,取值为0到1;为第个高斯分布函数的系数,为高斯分布函数; S20224、更新参数: ; ; ; 式中,为更新的第个高斯分布函数的均值的迭代值,为更新的第个高斯分布函数的方差的迭代值;为更新的第个高斯分布函数的系数的迭代值,表示第几个高斯成分的概率分布,为高斯分布的类别,为微分计算公式,为上一步骤的散度计算公式; S20225、迭代上面的步骤S20221-步骤S20224,直到收敛。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安煤科透明地质科技有限公司,其通讯地址为:710000 陕西省西安市西咸新区沣东新城能源金贸区西咸金融港1-A楼1401室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。