Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 沐曦集成电路(上海)股份有限公司雷秀洋获国家专利权

沐曦集成电路(上海)股份有限公司雷秀洋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉沐曦集成电路(上海)股份有限公司申请的专利一种矩阵乘法的加速方法、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119988811B

龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510480430.6,技术领域涉及:G06F17/16;该发明授权一种矩阵乘法的加速方法、电子设备及存储介质是由雷秀洋;杨加文;野昭东;董兆华设计研发完成,并于2025-04-17向国家知识产权局提交的专利申请。

一种矩阵乘法的加速方法、电子设备及存储介质在说明书摘要公布了:本发明涉及芯片设计技术领域,特别是涉及一种矩阵乘法的加速方法、电子设备及存储介质,其通过获取矩阵乘法累加器MMA中的第一输入矩阵块的期望存储类型;获取内存中存储第一输入矩阵块的矩阵数据的实际存储类型;当期望存储类型与实际存储类型不同时,从内存中读取矩阵数据并存入中间寄存器,将中间寄存器中按实际存储类型进行存储的矩阵数据转换为按期望存储类型进行存储的矩阵数据,得到期望的矩阵数据;将中间寄存器中存储的期望的矩阵数据存入共享内存;从共享内存中通过高宽位的数据搬移指令取出相应矩阵数据,并加载到寄存器中,交由MMA计算处理,本发明可直接使用高宽位的数据搬移指令搬移数据,达到提高数据搬运效率的目的。

本发明授权一种矩阵乘法的加速方法、电子设备及存储介质在权利要求书中公布了:1.一种矩阵乘法的加速方法,其特征在于,所述方法包括如下步骤: S100,获取矩阵乘法累加器MMA中的第一输入矩阵块的期望存储类型; S200,获取内存中存储第一输入矩阵块的矩阵数据的实际存储类型; S300,当所述第一输入矩阵块的期望存储类型与所述实际存储类型不同时,从内存中读取矩阵数据并存入中间寄存器,通过硬件指令将所述中间寄存器中按照所述实际存储类型进行存储的所述矩阵数据转换为按照所述期望存储类型进行存储的矩阵数据,得到期望的矩阵数据; S400,将所述中间寄存器中存储的所述期望的矩阵数据存入共享内存; S500,从所述共享内存中通过Q条数据搬移指令取出输入每个MMA的第一输入矩阵块的矩阵数据和第二输入矩阵块的矩阵数据,并将所述第一输入矩阵块和第二输入矩阵块的矩阵数据加载到专门为MMA提供矩阵数据的输入寄存器中;其中,Q满足:Q=U(T×H),其中,U为第一输入矩阵块和第二输入矩阵块的数据量,T为每条数据搬移指令每次搬移的数据量,H为每个执行单元的线程组中的线程数量; 当一个执行单元并行处理N个MMA的矩阵乘法时,所述内存按照实际存储类型存储N个MMA的N×M×K个矩阵元素的矩阵数据,其中,所述M×K个矩阵元素的矩阵数据为一个MMA的第一输入矩阵块的矩阵数据;通过一个执行单元的线程组并行读取N个MMA的矩阵数据,每个MMA的矩阵数据存储于N组中间寄存器;则S300中的所述转换步骤包括: S310,获取N组中间寄存器存储的所述N×M个矩阵元素; S320,通过硬件指令将当前线程处理的所述N组中间寄存器中存储的所述N×M个矩阵元素进行置换,将所述N×M个矩阵元素的实际存储类型转换为N个所述MMA的期望存储类型,得到期望的矩阵数据; 则S500中的U为M×K个矩阵元素的数据量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人沐曦集成电路(上海)股份有限公司,其通讯地址为:201203 上海市浦东新区中国(上海)自由贸易试验区郭守敬路498号8幢19号楼3层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。