中国科学院计算技术研究所叶剑获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院计算技术研究所申请的专利基于零样本学习跨语言层级架构的自然语言理解方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115688794B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211190548.8,技术领域涉及:G06F40/30;该发明授权基于零样本学习跨语言层级架构的自然语言理解方法及系统是由叶剑;马占宇;刘剑峰设计研发完成,并于2022-09-28向国家知识产权局提交的专利申请。
本基于零样本学习跨语言层级架构的自然语言理解方法及系统在说明书摘要公布了:本发明提出一种零样本学习跨语言层级架构的自然语言理解方法和系统,包括建立一个分层框架,以共同完成意图检测和槽的填充。本发明模型学会了对高维空间的预设意图进行分类,并在低层次的预测意图的指导下填充语义槽,以找到更多相关的意图论据以提高槽的填充性能。并且本发明还采用了预先训练好的语言无关的BiLSTM编码器来得出句子嵌入,并直接用于后面的意图检测分类任务,其中不同语言的句子嵌入在句子层面上是一致的。本发明进行在一个公共任务导向的对话数据集上进行了实验,结果表明本发明提出的方法在零点适应上达到了最优性能。
本发明授权基于零样本学习跨语言层级架构的自然语言理解方法及系统在权利要求书中公布了:1.一种基于零样本学习跨语言层级架构的自然语言理解方法,其特征在于,包括: 步骤1、获取由相同语种的L个词组成的语料u=[w1,w2,...wL]和其对应的一组意图类型I和槽类型S; 步骤2、将语料u输入BiLSTM编码器,其中该BiLSTM编码器能将不同语言的句子映射到 同一语义空间,得到多语言的句子嵌入,根据句子嵌入得到语料u的意图分布,选 择意图分布中概率最高的意图类型作为语料u的意图预测结果;根据意图分布和意 图类型I,构建意图损失; 步骤3、将语料u输入多语言模型mBERT,在多语言中产生上下文的词嵌入[e,e, ej...,e],,将每个词嵌入与意图预测结果的意图嵌入平均为词表 示,根据每个词的词表示,得到每个词的槽分布,选择槽分布中概率最高的槽 类型作为语料u的槽预测结果[s1,s2,...,sL];根据槽分布和槽类型S,构建槽损失; 步骤4、以该意图损失和该槽损失之和作为总损失,训练BiLSTM编码器和多语言模型mBERT,直到达到预设迭代次数或该总损失收敛,保存当前BiLSTM编码器和多语言模型mBERT,作为自然语言理解模型,将与该语料u语种相异的待理解的自然语言输入至该自然语言理解模型,得到该自然语言的意图预测结果和槽预测结果,以解析得到该自然语言的对话语篇。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算技术研究所,其通讯地址为:100080 北京市海淀区中关村科学院南路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励