Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京融威众邦科技股份有限公司刘璐获国家专利权

北京融威众邦科技股份有限公司刘璐获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京融威众邦科技股份有限公司申请的专利一种医疗问答大模型的语料库构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119670869B

龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510193391.1,技术领域涉及:G06N5/022;该发明授权一种医疗问答大模型的语料库构建方法及系统是由刘璐设计研发完成,并于2025-02-21向国家知识产权局提交的专利申请。

一种医疗问答大模型的语料库构建方法及系统在说明书摘要公布了:本发明涉及数据处理领域,具体是一种医疗问答大模型的语料库构建方法及系统,基于现有语料库构建三元组知识图谱,然后将网络中多个信息发布方的历史语料与三元组知识图谱进行匹配,从而确定多个信息发布方在历史信息发布过程中的可靠性,进而将可信的信息发布方筛选出。接着利用三元组知识图谱来对信息发布方发布的历史语料进行可信校验,如果发布的历史语料符合三元组知识图谱中的规律,则直接收录至当前语料库中。如果不符合,则放入扩展库中进行交叉验证或者人工校验。本申请可以利用网络语料对语料库进行扩充,在扩充时,利用现有语料库的三元组知识图谱来对信息发布方以及语料进行可靠性校验,保证了扩充语料的可靠性。

本发明授权一种医疗问答大模型的语料库构建方法及系统在权利要求书中公布了:1.一种医疗问答大模型的语料库构建方法,其特征在于,包括步骤: 获取医疗问答大模型的当前语料库以及由多个信息发布者发布的历史语料,其中,所述当前语料库包括多条语料数据; 基于所述多条语料数据构建三元组知识图谱;基于所述多条语料数据构建三元组知识图谱,包括:分别从多条语料数据中提取三元组实体模板,其中,所述三元组实体包括主体模板、关系实体模板和客体模板;将所述三元组实体模板转换为实体模板向量,并对主体模板和客体模板的实体模板向量分别在多个维度进行聚类,得到每个维度的多个主体簇和多个客体簇,其中,所述多个维度包括基本概念、功能和原理;对多个主体簇和多个客体簇进行标注,得到每个主体模板和客体模板的标签;基于带有标签的三元组实体模板构建三元组知识图谱; 提取所述历史语料的三元组实体,并将所述历史语料的三元组实体与所述三元组知识图谱进行匹配,得到匹配结果,其中,所述匹配结果包括一致、矛盾和未匹配;提取所述历史语料的三元组实体,并将所述历史语料的三元组实体与所述三元组知识图谱进行匹配,得到匹配结果,包括:提取所述历史语料中的主体、关系主体和客体;并将所述主体、所述关系主体和所述客体进行向量化处理,得到主体向量、关系主体向量和客体向量;将所述主体向量混入至带有标签的主体模板的实体模板向量中进行多次聚类,并将所述主体向量所在簇内其他向量的标签作为所述主体向量的标签;将所述客体向量混入至带有标签的客体模板的实体模板向量中进行多次聚类,并将所述客体向量所在簇内其他向量的标签作为所述客体向量的标签;对所述三元组实体与所述三元组知识图谱进行基于标签的规则匹配,得到匹配结果;对所述三元组实体与所述三元组知识图谱进行基于标签的规则匹配,得到匹配结果,包括:从所述三元组知识图谱中筛选出主体模板与所述三元组实体的主体相同的目标三元组实体模板;将所述三元组实体与所述目标三元组实体模板进行对比;在所述三元组实体与所述目标三元组实体模板符合第一目标条件时,判定匹配结果为一致;在所述三元组实体与所述目标三元组实体模板符合第二目标条件时,判定匹配结果为矛盾;以及在所述三元组实体与所述目标三元组实体模板符合第三目标条件时,判定匹配结果为未匹配;其中,所述第一目标条件包括:客体与客体模板的相似度大于预设的相似度阈值,关系实体与所述关系实体模板的相似度大于预设相似度阈值;所述第二目标条件包括:客体与客体模板的相似度大于预设的相似度阈值,关系实体与所述关系实体模板的含义相反;或者;关系实体与所述关系实体模板的相似度大于预设相似度阈值,客体的任意标签与客体模板的任意标签不同;所述第三目标条件包括:客体与客体模板的相似度大于预设的相似度阈值,关系实体与所述关系实体模板的含义不相反,且关系实体与所述关系实体模板的相似度小于或者预设相似度阈值;或者;关系实体与所述关系实体模板的相似度大于预设相似度阈值,客体与客体模板不一致,且客体的标签与客体模板存在相同标签;或者;关系实体与所述关系实体模板的相似度小于或者等于预设相似度阈值,且客体与客体模板不一致; 基于所述匹配结果对所述信息发布者的置信度进行评价,得到多个信息发布者的置信度; 将置信度大于预设阈值的信息发布者作为可信发布者,并基所述三元组知识图谱确定所述可信发布者的可信语料和待确认语料,将所述可信发布者的可信语料收录至所述当前语料库,并将所述可信发布者的待确认语料收录至扩展语料库; 对所述扩展语料库中的待确认语料进行二次验证,并将通过二次验证的待确认语料收录至所述当前语料库中,其中,所述二次验证的方式包括交叉验证和人工校验。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京融威众邦科技股份有限公司,其通讯地址为:100143 北京市海淀区长春桥路11号2号楼16层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。