江苏红网技术股份有限公司陈军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏红网技术股份有限公司申请的专利一种语义理解与问答的匹配方法及其系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119128077B 。
龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411139695.1,技术领域涉及:G06F16/3329;该发明授权一种语义理解与问答的匹配方法及其系统是由陈军;刘海东;康夺设计研发完成,并于2024-08-20向国家知识产权局提交的专利申请。
本一种语义理解与问答的匹配方法及其系统在说明书摘要公布了:本发明公开了一种语义理解与问答的匹配方法及其系统,包括语义问答信息采集、数据库数据处理、语义理解优化处理、检索增强生成、以及答案生成与质量控制,即使用自然语言处理经数据预处理后的数据集,并基于深度学习模型来提取查询和文档的语义特征,捕获并确定所述上下文信息和长距离依赖关系之间的映射关系选取出上下文信息中的核心字段信息,并生成核心字段的集合后进行高质量问答数据的生成。本发明利用深度学习模型来提取查询和文档的语义特征,捕获上下文信息和长距离依赖关系,进而实现对核心字段的上下文关联分析,并改善了答案的匹配生成机制生成高质量的回答信息,提高了语义分析的准确性和效率。
本发明授权一种语义理解与问答的匹配方法及其系统在权利要求书中公布了:1.一种语义理解与问答的匹配方法,其特征在于,包括: 语义问答信息采集,通过词性分析对所采集的语义问答数据进行整理,获取统一格式语义问答信息,并将统一格式语义问答信息录入数据库中; 数据库数据处理,对统一格式语义问答信息进行字段的划分并划分出数据集,对数据集进行数据的预处理并确定; 语义理解优化处理,使用自然语言处理经数据预处理后的数据集,并基于深度学习模型来提取查询和文档的语义特征,捕获上下文信息和长距离依赖关系,并确定所述上下文信息和长距离依赖关系之间的映射关系,根据上下文信息和长距离依赖关系之间的映射关系进行权重赋值,选取出上下文信息中的核心字段信息,并生成核心字段的集合;所述基于深度学习模型来提取查询和文档的语义特征,具体采用聚类算法对数据集进行聚类处理,将完整的数据集根据提取查询和文档数据分若干个类别,并通过K值聚类算法确定每一个类别的核点,将核点作为该类别的优化聚类中心,并计算核点与优化聚类中心的欧式距离值,将所述欧式距离值确定为聚类样本与训练样本之间的距离度量,并将聚类样本与训练样本之间的距离度量作为预测待提取查询和文档的语义特征样本的数值输出;所述聚类样本与训练样本之间的距离度量计算如下: 其中,Distxi,yj为聚类样本xi与训练样本之间的距离度量值,xik为第k个聚类样本xi,yjk为第k个训练样本yj; 根据上下文信息和长距离依赖关系之间的映射关系进行权重赋值,选取出上下文信息中的核心字段信息,并生成核心字段的集合,具体通过分析核心字段信息的区分度来确定映射关系的权重赋值,如下: 其中,n表示第i个聚类样本xi的项数,fi表示为数据集聚类样本xi出现的频率,表示聚类样本xi作为区分的对数值,m表示为聚类样本xi被记录的核心字段数量,Hi表示第i个聚类样本xi的区分值;M表是聚类样本xi中核心字段的总数,Qi表示第i个聚类样本xi的区分度,即确定为核心字段信息在上下文信息中的权重赋值; 检索增强生成,基于从数据库检索所关联的相关信息,将检索到的所关联的相关信息与语言大模型相结合后,根据相似性分析生成对应的回答信息; 答案生成与质量控制,响应所述回答信息,并基于所述语言大模型所检索到的信息,确定并根据回答信息中的组织结构特征、流畅度特征、以及事实一致性特征进行语义字段的优化后,生成优化后的答案信息并输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏红网技术股份有限公司,其通讯地址为:210000 江苏省南京市雨花台区宁双路19号云密城D幢10F;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。