北京大学梁云获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京大学申请的专利一种深度神经网络硬件加速器装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116451752B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310229718.7,技术领域涉及:G06N3/063;该发明授权一种深度神经网络硬件加速器装置是由梁云;贾连成设计研发完成,并于2023-03-10向国家知识产权局提交的专利申请。
本一种深度神经网络硬件加速器装置在说明书摘要公布了:本发明公布了一种深度神经网络硬件加速器装置,包括:矩阵计算核心模块、向量计算核心模块、片上缓存模块、直接内存访问DMA数据传输控制器模块和可配置互联网络模块;其中,矩阵计算核心模块和向量计算核心模块支持不同的可重构选项;矩阵计算核心模块和向量计算核心模块通过可配置互联网络模块,与多个片上缓存模块进行连接;可重构选项包括权重固定数据流和输出固定数据流;重构方式包括可重构数据流加速器RDA、可重构功能加速器RFA以及异构多数据流加速器HDA。本发明能够同时实现多种重构方式,实现对不同DNN网络的高效处理。
本发明授权一种深度神经网络硬件加速器装置在权利要求书中公布了:1.一种深度神经网络硬件加速器装置,其特征是,包括:矩阵计算核心模块、向量计算核心模块、片上缓存模块、直接内存访问DMA数据传输控制器模块和可配置互联网络模块;其中,矩阵计算核心模块和向量计算核心模块支持不同的可重构选项;可重构选项包括权重固定数据流和输出固定数据流;重构方式包括可重构数据流加速器RDA、可重构功能加速器RFA以及异构多数据流加速器HDA; 矩阵计算核心模块采用标准脉动阵列架构构建,硬件结构为N×N的脉动阵列,包含N^2个计算单元PE;数据流在权重固定数据流和输出固定数据流之间变化,支持不同矩阵格式;矩阵计算核心模块用于直接运行标准矩阵乘法、转置矩阵乘法,及基于标准矩阵乘法与转置矩阵乘法的卷积运算; 向量计算核心模块由M个向量计算单元VALU串联而成,每个VALU由N个并行的算术逻辑单元ALU组成;每个ALU均有一个输出寄存器;ALU具有可配置的向量运算功能,通过ALU互连实现针对多种数据重用模式进行配置;向量计算核心模块包括3个输入端口和1个输出端口;输入端口和输出端口均与缓存相连接;向量计算核心模块用于执行一元运算、二元运算和三元运算;通过向量计算核心模块支持不同可重配置数据流和多种不同操作数的重构; DMA数据传输控制器模块包括访存地址生成器和AXI总线协议接口,用于加速器和外部存储的通信,实现同时在片上缓存和片外DDR中交换数据; 可重配置互联网络模块用于控制片上缓存模块与两个计算核心模块之间的数据移动方式,并向其他每个模块发送对应的配置信息;矩阵计算核心模块和向量计算核心模块通过可配置互联网络模块,与多个片上缓存模块进行连接; 片上缓存模块包括多个片上缓存组BUFG;每个片上缓存组包含三个缓存单元;用于保存从加速器外部加载的矩阵数据;每个缓存单元有多个存储区,对应每个计算核心和DMA数据传输控制器中的多个数据端口。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100871 北京市海淀区颐和园路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励