Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西北工业大学郭斌获国家专利权

西北工业大学郭斌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西北工业大学申请的专利一种基于群智知识图谱的富语义多样化对话内容生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116166815B

龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211686396.0,技术领域涉及:G06F16/36;该发明授权一种基于群智知识图谱的富语义多样化对话内容生成方法是由郭斌;王豪;刘佳琪;於志文;邱晨;王柱;梁韵基设计研发完成,并于2022-12-26向国家知识产权局提交的专利申请。

一种基于群智知识图谱的富语义多样化对话内容生成方法在说明书摘要公布了:本发明涉及一种基于群智知识图谱的富语义多样化对话内容生成方法,具体过程为,收集用户在社交媒体平台上表达的观点和态度内容,构建三层群智知识图谱:1领域常识知识图谱2群智描述知识图谱3群智表达知识图谱;构建门控融合动态知识依赖模型,编码阶段利用群智知识图谱对输入对话上下文进行语义增强,解码阶段利用门控融合的动态知识依赖解码机制,门控机制从局部语义角度融合常识和描述知识,提升内容表达多样性和主观性,动态知识依赖机制从全局语法角度融合表达知识,保证回复内容逻辑通顺流畅;利用对话数据对模型进行训练,训练完成后即可根据输入对话内容自动生成信息量丰富、多样性较高的高质量。

本发明授权一种基于群智知识图谱的富语义多样化对话内容生成方法在权利要求书中公布了:1.一种基于群智知识图谱的富语义多样化对话内容生成方法,其特征在于步骤如下: 步骤1:收集群体表达数据,从社交媒体平台上收集用户关于特定事物表达的评价和观点内容,作为群智知识图谱知识来源,为后续的群智知识图谱构建提供支持; 步骤2:构建三层群智知识图谱G=GC,GD,GE,其中领域常识知识图谱 包含特定领域内的常识知识信息,其中为知识三元组h,r,t,表达头实体和尾实体之间的关系;群智描述知识图谱关于事物的描述性知识信息,反映对于事物的主观感知和感性态度,其中为知识三元组,GD中包含两种关系,群体话题和群体共识;群体话题反映人们在讨论同一事物时最为关注的方面和属性,反映了事物的内在属性,群体共识反映了人们在讨论同一事物时被大多数用户认可和表达的内容;利用融合短语的话题抽取方法和话题偏置的TextRank算法进行群体话题和群体共识的挖掘;群智表达知识图谱为自然语言表达结构层面的知识,反映了语言的上下文关联和语法依赖关系,为知识三元组,利用语法图进行GE的构建,通过对用户表达内容进行语法图分析,得到单词之间的语法词性和语法依赖关系; 步骤3:构建门控融合动态知识依赖模型的分层语义增强编码模块;首先定义模型的输入对话上下文序列X={x1,x2,…,xn},以及构建完成的群智知识图谱G=GC,GD,GE,模型目标输出为相应的对话回复Y={y1,y2,…,ym};根据输入对话上下文从群智知识图谱中抽取三个知识子图序列 对于从常识和描述图谱中抽取出的知识,将其视为文本序列,利用Transformer模型进行编码,如下: zi=Transformerki 对于从表达图谱中抽取出的知识,利用静态图注意力机制,融合多个知识三元组之间的边和节点的结构信息,如下: 其中hn,rn,tn分别代表知识三元组中的头实体、关系和尾实体;ne代表表达图谱中的知识三元组的数量;Wr,Wh,Wt为三个可权重矩阵,训练过程进行随机初始化,用于建模头实体、关系和尾实体之间的语义关联;最后,利用静态图注意力机制将所有知识向量进行融合,得到最终抽取出的知识向量语义表示如下: 其中Wz为两个可训练权重矩阵,训练过程中进行随机初始化,用于将知识向量语义表征映射到统一维度;串联与对应输入单词词向量ωxt得到知识增强的对话上下文向量表示将对话上下文向量表示序列作为编码器GRU的输入,得到编码隐藏状态序列H={h1,h2,…,hn},如下: ht=GRUht-1,ext 步骤4:构建门控融合的动态知识依赖解码器;解码器在解码过程利用门控机制和动态知识依赖机制动态调整不同类型知识的注意力权重和利用程度;解码器GRU在每个解码时刻融合上一时刻解码隐藏状态向量st、对话上下文注意力向量门控知识向量表达知识向量以及上一时刻解码生成的单词的向量表示eyt,进行单词的预测生成过程,如下: 其中,对话上下文注意力向量在每个解码时刻通过计算上一时刻解码隐藏状态向量st与编码隐藏状态序列H的注意力得到,如下: qt=softmaxαt 其中Wh和Ws两个可训练权重矩阵,训练过程中进行随机初始化,用于将hi和st映射到统一维度,bq表示偏置矩阵,n表示编码阶段输入句子的长度; 表达知识在解码过程中从全局语法角度控制生成句子的语法结构;根据解码隐藏状态st动态更新表达知识向量实现语法表达知识的动态调整,如下: 其中We和Ws e为两个可训练权重矩阵,训练过程中进行随机初始化,用于将和st映射到统一维度,be表示偏置矩阵,n1表示可融合的表达知识的数量; 根据同样计算方式得到常识知识向量和描述知识向量利用门控机制决定常识和描述知识中的语义表达程度,得到门控知识向量如下,: 其中vg表示权重矩阵,bg表示偏置矩阵,在训练过程中进行随机初始化;σ表示sigmoid激活函数; 步骤5:知识感知的拷贝模块,通过显示拷贝输入和知识源中的单词实现最终回复的生成过程;在每个解码时刻t,预测单词分布为: 其中Wv表示权重矩阵,bv表示偏置矩阵,在训练过程中进行随机初始化; 为了避免出现超出词汇表的单词,利用指针机制显式的从知识源和输入序列中进行单词拷贝;从输入、常识知识图谱、群智描述图谱、群智表达图谱中进行拷贝的知识指针被定义为pQ,pC,pD,pE,计算方式如下: 其中均表示可训练权重矩阵,bxx∈q,c,d,e均表示偏置矩阵,在训练过程中进行随机初始化;σ表示sigmoid激活函数; 最终模型生成单词的概率分布如下: 其中Wp表示可训练权重矩阵,qti、分别表示解码隐藏状态st对对话上下文、常识知识、描述知识和表达知识的第i项经过softmax函数计算得到的注意力权重。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。