上海交通大学龙嘉蓓获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海交通大学申请的专利基于Tensor Core的图神经网络计算加速方法、系统、介质、电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119830974B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411862127.4,技术领域涉及:G06N3/063;该发明授权基于Tensor Core的图神经网络计算加速方法、系统、介质、电子设备是由龙嘉蓓;梁晓峣;景乃锋;刘子钊设计研发完成,并于2024-12-17向国家知识产权局提交的专利申请。
本基于Tensor Core的图神经网络计算加速方法、系统、介质、电子设备在说明书摘要公布了:本发明提供一种基于TensorCore的图神经网络计算加速方法、系统、介质、电子设备,所述方法包括以下步骤:将稀疏矩阵划分为多个子矩阵块,每个子矩阵块的大小和TensorCore的矩阵运算单元的计算粒度相匹配;对所述子块矩阵中的全零行进行重新排列,以在所述稀疏矩阵中构建全零子块矩阵并在TensorCore中跳过所述全零子块矩阵的计算。本发明的基于TensorCore的图神经网络计算加速方法、系统、介质、电子设备能够在TensorCore上有效提升了图神经网络的计算性能和效率。
本发明授权基于Tensor Core的图神经网络计算加速方法、系统、介质、电子设备在权利要求书中公布了:1.一种基于Tensor Core的图神经网络计算加速方法,其特征在于:所述方法包括以下步骤: 将稀疏矩阵划分为多个子矩阵块,每个子矩阵块的大小和Tensor Core的矩阵运算单元的计算粒度相匹配; 对所述子矩阵块中的全零行进行重新排列,以在所述稀疏矩阵中构建全零子块矩阵并在Tensor Core中跳过所述全零子块矩阵的计算; 对所述子块矩阵中的全零行进行重新排列,以在所述稀疏矩阵中构建全零子块矩阵并在Tensor Core中跳过所述全零子块矩阵的计算包括以下步骤: 设置一个阈值; 当所述子矩阵块中的全零行的数量大于0且小于等于所述阈值时,将所述子矩阵块设定为目标子矩阵块; 将横向的一排子矩阵块构建为一横向子矩阵组; 获取所述目标子矩阵块中全零行所在的行在纵向上与所有横向子矩阵组的公共邻居数量; 将所述全零行所在的行移动至所述公共邻居数量最多的横向子矩阵组的全零行所在的行,以在所述稀疏矩阵中构建全零子块矩阵并在Tensor Core中跳过所述全零子块矩阵的计算; 还包括对特征矩阵进行压缩加速处理;其中对特征矩阵进行压缩加速计算包括以下步骤: 对于所述特征矩阵,针对最大精度进行比特拆分以获取拆分矩阵,为每个拆分矩阵生成一个量化掩码,所述量化掩码中的每一位表示所述拆分矩阵中对应元素是否被量化到预设精度; 将所述量化掩码按照32比特粒度进行按位或操作,生成压缩掩码; 仅针对所述压缩掩码不为0的元素进行数据计算和访问; 还包括对左矩阵和右矩阵进行压缩加速计算;对左矩阵和右矩阵进行压缩加速计算包括以下步骤: 将所述子矩阵块按照32bit的粒度划分为多个子矩阵单元; 为每个子矩阵单元设置一个压缩掩码;其中当所述子矩阵单元的元素均为0时,所述压缩掩码为0,否则所述压缩掩码为1; 对所述左矩阵和所述右矩阵的压缩编码进行按位与操作,获取结果掩码; 在进行所述左矩阵和所述右矩阵的乘法运算时,跳过所述结果掩码为0的子矩阵单元; 将所述左矩阵和所述右矩阵的压缩掩码保存在共享寄存器中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海交通大学,其通讯地址为:200240 上海市闵行区东川路800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励