中国人民解放军国防科技大学胡议月获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利面向三重稀疏矩阵乘法的硬件加速器、设备及其应用方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121365041B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511941899.1,技术领域涉及:G06F15/78;该发明授权面向三重稀疏矩阵乘法的硬件加速器、设备及其应用方法是由胡议月;胡安;聂永璋;周鹿晨;郭辉;付文文;王永文设计研发完成,并于2025-12-22向国家知识产权局提交的专利申请。
本面向三重稀疏矩阵乘法的硬件加速器、设备及其应用方法在说明书摘要公布了:本发明公开了一种面向三重稀疏矩阵乘法的硬件加速器、设备及其应用方法,本发明的硬件加速器包括依次相连的高带宽存储器HBM、交叉开关网络和片上处理单元,所述片上处理单元包括层次化缓存模块、全局控制器和多个计算片,每一个计算片包括RA计算阵列、TP计算阵列和局部控制器,其中RA计算阵列、TP计算阵列分别用于执行三重稀疏矩阵乘法中的前端运算T=R×A和后端运算C=T×P。本发明旨在解决传统通用处理器在处理三重稀疏矩阵乘法时因不规则内存访问、计算负载不均以及中间部分和结果激增而导致的巨量片外数据搬运、面临严重的性能与能效瓶颈的问题,提升三重稀疏矩阵乘法的计算性能和能效。
本发明授权面向三重稀疏矩阵乘法的硬件加速器、设备及其应用方法在权利要求书中公布了:1.一种面向三重稀疏矩阵乘法的硬件加速器,其特征在于,包括依次相连的高带宽存储器、交叉开关网络和片上处理单元,所述片上处理单元包括层次化缓存模块、全局控制器和多个计算片,所述全局控制器用于给计算片下发计算任务,每一个计算片包括RA计算阵列、TP计算阵列和局部控制器,其中RA计算阵列用于执行三重稀疏矩阵乘法C=R×A×P中的前端运算T=R×A,TP计算阵列用于执行三重稀疏矩阵乘法C=R×A×P中的后端运算C=T×P,所述层次化缓存模块包括用于给RA计算阵列提供输入的矩阵R数据缓存的R-便签存储器、输入的矩阵A数据缓存的A-二级缓存、输出的矩阵T数据缓冲的T-缓冲,用于给TP计算阵列提供输入的矩阵P数据缓存的P-二级缓存以及用于结果矩阵C数据缓存的C-缓存;所述局部控制器分别用于控制RA计算阵列、TP计算阵列,通过T-缓冲耦合形成异步的两级计算流水线,以及将C-缓存中的结果矩阵C写回高带宽存储器,所述RA计算阵列中RA计算单元自带的A-一级缓存和A-二级缓存形成矩阵A数据的两级缓存,所述TP计算阵列中TP计算单元自带的P-一级缓存和P-二级缓存形成矩阵P数据的两级缓存;所述高带宽存储器的多个数据通道按职责划分为多组以分别承载矩阵R、A、P的读取流与结果矩阵C的写回流,所述交叉开关网络包括P交叉开关、C交叉开关、R交叉开关和A交叉开关,所述高带宽存储器中用于存储矩阵P的组通过P交叉开关与P-二级缓存相连,所述高带宽存储器中用于存储矩阵C的组通过C交叉开关与C-缓存相连,所述高带宽存储器中用于存储矩阵R的组通过R交叉开关与R-便签存储器相连,所述高带宽存储器中用于存储矩阵A的组通过A交叉开关与A-二级缓存相连;所述层次化缓存模块中,R-便签存储器、A-二级缓存、T-缓冲和C-缓存为各个计算片所独有,P-二级缓存为所有计算片所共有,所有计算片中的TP计算阵列均通过同一个全局交叉开关与所有计算片所共有的P-二级缓存相连。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励