华南理工大学陆璐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种基于atlas 800平台的三角矩阵乘法的加速方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118567852B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410699460.1,技术领域涉及:G06F9/50;该发明授权一种基于atlas 800平台的三角矩阵乘法的加速方法是由陆璐;邓旭辉设计研发完成,并于2024-05-31向国家知识产权局提交的专利申请。
本一种基于atlas 800平台的三角矩阵乘法的加速方法在说明书摘要公布了:本发明涉及高性能计算、算力优化领域,为一种基于atlas800平台的三角矩阵乘法的加速方法,包括将结果矩阵切分为多个任务块,基于多个任务块预设均衡划分策略;在vector计算单元上生成mask矩阵,将mask矩阵存回全局内存;从全局内存读取矩阵和mask矩阵,采用vector计算单元实现矩阵三角掩盖,得到三角掩盖后的三角矩阵A;基于三角掩盖后的三角矩阵A,根据预设的均衡划分策略调用cube计算单元完成所有任务块的矩阵乘法运算,得到结果矩阵。本发明采用vector计算单元和cube计算单元相结合的mix方法完成三角矩阵乘法,提高了三角矩阵乘法在NPU上的计算效率,可以充分发挥华为atlas800NPU算力,加速三角矩阵乘法计算,为深度学习和科学计算等领域提供算力支持。
本发明授权一种基于atlas 800平台的三角矩阵乘法的加速方法在权利要求书中公布了:1.一种基于atlas800平台的三角矩阵乘法的加速方法,其特征在于,包括以下步骤: S1、将结果矩阵切分为多个任务块,基于多个任务块预设均衡划分策略; S2、在vector计算单元上生成mask矩阵,将mask矩阵存回全局内存; S3、从全局内存读取原始矩阵和mask矩阵,采用vector计算单元实现矩阵三角掩盖,得到三角掩盖后的三角矩阵A; S4、基于三角掩盖后的三角矩阵A,根据预设的均衡划分策略调用cube计算单元完成所有任务块的矩阵乘法运算,得到结果矩阵; 所述步骤S4包括: S41、通过设置判断函数优化矩阵乘法计算方法,得到优化的矩阵乘法计算方法步骤; S42、基于三角掩盖后的三角矩阵A,根据预设的均衡划分策略调用cube计算单元,通过优化的矩阵乘法计算方法步骤完成所有任务块的矩阵乘法运算,得到结果矩阵; 所述优化的矩阵乘法计算方法步骤包括: 对于任务块x,y,三角矩阵A中x行从左到右的第i个块和通用矩阵B中y列从上到下的第i个块做矩阵乘法,得到中间结果,其中x,y分别为结果矩阵C中某个任务块的行数和列数,任务块大小为m×m,结果矩阵C大小为M×N;设置判断函数为: ; 将中间结果全部做矩阵加法累加在一起,得到该任务块的最终结果为,求出所有,得到完整的结果矩阵C。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励