清华大学胡杨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学申请的专利低复杂度Transformer注意力模块预测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119312839B 。
龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411179921.9,技术领域涉及:G06N3/045;该发明授权低复杂度Transformer注意力模块预测方法及装置是由胡杨;王辉征;方佳豪;韩慧明;尹首一设计研发完成,并于2024-08-27向国家知识产权局提交的专利申请。
本低复杂度Transformer注意力模块预测方法及装置在说明书摘要公布了:本申请涉及一种低复杂度Transformer注意力模块预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:获取对神经网络模型的第一矩阵进行前导零计数处理得到的第一前导零计数结果;神经网络模型的注意力权重矩阵为第一矩阵,输入神经网络模型的词元矩阵为第二矩阵;或者输入神经网络模型的词元矩阵为第一矩阵,神经网络模型的注意力权重矩阵为第二矩阵;基于第一前导零计数结果,对第二矩阵进行乘法近似移位处理,得到查询矩阵和键矩阵;基于查询矩阵和键矩阵,确定注意力矩阵的预测结果;注意力矩阵的预测结果用于表征上下文词元的匹配程度。采用本方法能够减少硬件资源开销。
本发明授权低复杂度Transformer注意力模块预测方法及装置在权利要求书中公布了:1.一种低复杂度Transformer注意力模块预测方法,其特征在于,所述方法包括: 获取对神经网络模型的第一矩阵进行前导零计数处理得到的第一前导零计数结果;所述神经网络模型的注意力权重矩阵为所述第一矩阵,输入所述神经网络模型的词元矩阵为第二矩阵;或者输入所述神经网络模型的词元矩阵为所述第一矩阵,所述神经网络模型的注意力权重矩阵为第二矩阵; 基于所述第一前导零计数结果,对所述第二矩阵进行乘法近似移位处理,得到查询矩阵和键矩阵;其中,乘法近似移位处理实现乘法近似的原理为:对于一个整数类型二进制数x,其数学表示为x=sign×2W-LO-1×M,其中,sign表示其符号位,W表示量化位宽,LO表示前导零的位数,M表示尾数,其数值位于区间[1,2],对于两个二进制数的相乘,表示为: x×y=XORSx,Sy×2Wx+Wy-LOx+LOy-2×Mx×My; 其中,Sx和Sy分别表示x和y的符号位,两个数相乘,乘积的符号位相当于两个乘数符号位的异或,Wx和Wy分别表示x和y的量化位宽,LOx和LOy表示x和y的前导零个数,Mx和My分别表示x和y的尾数,由于尾数位于[1,2]之间,用x和y的前导零移位来对两个数的相乘进行近似,即: x×y≈XORSx,Sy×2Wx+Wy-LOx+LOy-2×Mx; 基于所述查询矩阵和所述键矩阵,确定注意力矩阵的预测结果;所述注意力矩阵的预测结果用于表征上下文词元的匹配程度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区清华园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励