Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江大学寿黎但获国家专利权

浙江大学寿黎但获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江大学申请的专利一种结合外部知识检索增强大语言模型的数据匹配方法、设备、介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119474262B

龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411333724.8,技术领域涉及:G06F16/332;该发明授权一种结合外部知识检索增强大语言模型的数据匹配方法、设备、介质是由寿黎但;徐雍钦;陈珂;李环;骆歆远;陈刚设计研发完成,并于2024-09-24向国家知识产权局提交的专利申请。

一种结合外部知识检索增强大语言模型的数据匹配方法、设备、介质在说明书摘要公布了:本发明公开了一种结合外部知识检索增强大语言模型的数据匹配方法、设备、介质,包括:将数据匹配任务拆解为自然语言形式的规则集合;遍历数据匹配数据集中的每一样本;对于第i个样本,获取该样本中与源数据库相关的数据库角色实体及其元数据;将数据库角色实体作为索引,其对应的元数据作为值构建第一知识集;将该样本输入大语言模型以提取关键词,检索得到关键词在外部领域知识库中对应的实体,并获取该实体的one‑hop关系;将关键词作为索引,其对应的one‑hop关系作为值构建第二知识集;获取压缩后的in‑context示例数据;基于规则集合、第一知识集、第二知识集、压缩的in‑context示例数据构建提示词并输入至大语言模型,得到数据匹配结果。

本发明授权一种结合外部知识检索增强大语言模型的数据匹配方法、设备、介质在权利要求书中公布了:1.一种结合外部知识检索增强大语言模型的数据匹配方法,其特征在于,所述方法包括: 将数据匹配任务拆解为自然语言形式的规则集合; 遍历数据匹配数据集中的每一样本;对于第i个样本,获取第i个样本中与源数据库相关的数据库角色实体;遍历数据匹配数据集中除了第i个样本以外的样本,以获取第i个样本对应的数据库角色实体的元数据;将数据库角色实体作为索引,其对应的元数据作为值从而构建第一知识集; 遍历数据匹配数据集中的每一样本;对于第i个样本,将第i个样本输入大语言模型以提取关键词;基于关键词检索外部领域知识库,得到关键词在外部领域知识库中对应的实体,并在外部领域知识库中检索该实体的one-hop关系;将关键词作为索引,其对应的one-hop关系作为值从而构建第二知识集; 从数据匹配数据集中选择原始in-context示例数据,将原始in-context示例数据输入大语言模型,获取压缩的in-context示例数据; 基于规则集合、第一知识集、第二知识集、压缩的in-context示例数据构建提示; 将提示输入至大语言模型,得到数据匹配结果; 其中,当数据匹配任务为模式匹配时,所述规则集合包括: 第一规则:第二规则、第三规则和第四规则必须依次检查,直到得出结论; 第二规则:如果两个模式的列在数据库中数据类型不相同,则答案为否,否则检查规则第三规则; 第三规则:如果两个模式的表在语义上不相同,则答案为否,否则请检查规则第四规则; 第四规则:如果两个模式的列不指向同一个概念,则答案为否,否则答案为是; 当数据匹配任务为实体匹配时,所述规则集合包括: 第一规则:第二规则、第三规则和第四规则必须依次检查,直到得出结论; 第二规则:如果第一实体是第二实体的缩写或相反,则答案为是,否则检查规则第三规则; 第三规则:如果第一实体是第二实体的别名或反之,则答案为是,否则检查规则第四规则; 第四规则:如果第一实体和第二实体指的是同一个现实世界概念,则答案为是,否则则答案为否; 其中,基于规则集合、第一知识集、第二知识集、压缩的in-context示例数据构建提示词的过程包括: 初始化增强示例数据列表; 遍历所有压缩的in-context示例数据;对于第i个压缩的in-context示例数据,基于规则集合生成推理以及答案;将推理以及答案拼接于第i个压缩的in-context示例数据的末尾,得到第i个压缩的in-context示例数据对应的增强示例数据,并添加至增强示例数据列表; 遍历数据匹配数据集中的每一样本;对于第i个样本,第一知识集和第二知识集的总数为n,获取第一知识集和第二知识集中第i个样本对应的n个知识列表;对于某一知识列表,将任务指令、规则集合、增强示例数据列表、第i个样本、当前知识列表进行拼接,得到第i个样本当前知识列表对应的提示;遍历每一知识列表,得到第i个样本对应的n个提示。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。