北京理工大学冯冲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种基于局部短语句法增强机制的神经机器翻译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114021590B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111314481.X,技术领域涉及:G06F40/58;该发明授权一种基于局部短语句法增强机制的神经机器翻译方法是由冯冲;张天夫;惠子杨;王黎超设计研发完成,并于2021-11-08向国家知识产权局提交的专利申请。
本一种基于局部短语句法增强机制的神经机器翻译方法在说明书摘要公布了:本发明涉及一种基于局部短语句法增强机制的神经机器翻译方法,属于自然语言处理机器翻译技术领域。首先构建各个元素的局部短语序列,通过局部短语序列构建相对短语位置向量矩阵。然后,识别冗余头,根据句法注意力的平均权重动态确定训练过程中每个头的重要性。最后使用基于局部短语的句法增强的注意力机制代替原本的冗余头,以激活其潜在能力。本发明能够准确地识别多头注意力机制中的重要头和冗余头,并通过基于局部短语的句法增强机制来对冗余头进行修改,所构建的自注意力网络可用于机器翻译研究,取得了良好的效果。
本发明授权一种基于局部短语句法增强机制的神经机器翻译方法在权利要求书中公布了:1.一种基于局部短语句法增强机制的神经机器翻译方法,其特征在于,包括以下步骤: 步骤1:构建各个元素的局部短语序列: 在标准注意力机制基础上,进一步增加局部短语偏置: 其中,Pi,j表示局部短语偏置矩阵;Att表示注意力机制;Qi表示单词i的查询query;Kj表示单词j的键值key;xi表示单词i的词嵌入向量;xj表示单词j的词嵌入向量;WQ表示查询query权重矩阵;WK表示键值key权重矩阵;T表示对矩阵做转置操作,dk表示向量维度; 步骤2:通过局部短语序列,构建相对短语位置向量矩阵; 包括以下步骤: 为获取局部短语偏置向量p,首先要从成分树中抽取相对短语位置矩阵RP; 给定一个RP∈Ru*u的矩阵,其中RP表示相对短语位置矩阵、u表示矩阵维度,每一个元素代表单词xi和单词xj之间的相对句法距离; 对于不在同一相对短语序列中的词对,将其相对距离设置为正无穷;对于处于同一相对短语序列中的词对,根据其相对短语层数设置其相对短语位置距离为其层数之差,由此得到矩阵RP; 将最大相对短语距离设置为确定值k,并将2k+1个不同的标签用于相对短语位置向量,将矩阵RP转换为相应的向量矩阵M∈Ru*u*dh,其中: Mij=wclipj-i,k clipx,k=max-k,mink,x 其中,Mij表示相应的向量矩阵,clipx,k表示取[-k,k]内的最大值,超出范围则取边界值; 之后,学习到相对短语距离表示w=w-k,…,wk,其中wi∈Rdh,Rdh表示dh维度的向量空间; 得到矩阵M之后,构建一个前馈网络来将相对局部短语位置向量Mij转化为相对局部短语位置隐状态;通过线性投影UP∈Rdh*1将隐状态映射为局部短语偏置矩阵P中的负标量Pij,即矩阵P的每一元素: P=-|tanhWPM+bPUP| 其中,WP∈Rdh*dh和bP∈Rdh均为模型的参数; 步骤3:识别冗余头,根据句法注意力的平均权重,动态确定训练过程中每个头的重要性; 步骤4:使用基于局部短语的句法增强的注意力机制代替原本的冗余头,激活其潜在能力。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励