湖南师范大学刘双龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南师范大学申请的专利基于动态可重构并行计算的CNN硬件加速方法和加速器获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116050471B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210947397.X,技术领域涉及:G06F7/544;该发明授权基于动态可重构并行计算的CNN硬件加速方法和加速器是由刘双龙;戴奎;谢哲韧设计研发完成,并于2022-08-09向国家知识产权局提交的专利申请。
本基于动态可重构并行计算的CNN硬件加速方法和加速器在说明书摘要公布了:本发明公开了一种基于动态可重构并行计算的CNN硬件加速方法和加速器,所述可重构并行计算方法为:首先根据用于运行CNN的实际硬件计算资源,设定计算CNN的总计算并行度P总总;然后在满足Pc*Pf=P总总的条件下,根据CNN各卷积层的输入通道个数C和输出通道个数F,动态地确定该卷积层对应的Pc和Pf的取值,进而使用Pc个MAC单元对该卷积层输入特征图进行不同输入通道之间的并行卷积计算,以及同时使用Pf个MAC单元对该卷积层不同输出通道之间的并行卷积计算。本发明可以根据不同卷积层的输入和输出通道数,对输入通道和输出通道两个方向的并行度进行动态调整,提高CNN的总体计算效率。
本发明授权基于动态可重构并行计算的CNN硬件加速方法和加速器在权利要求书中公布了:1.一种基于动态可重构并行计算的CNN硬件加速方法,其特征在于,所述可重构并行计算方法为:首先根据用于运行CNN的实际硬件计算资源,设定CNN的总计算并行度P总;然后在满足Pc*Pf=P总的条件下,根据CNN各卷积层的输入通道个数C和输出通道个数F,动态地确定该卷积层对应的Pc和Pf的取值,其中Pc=2m≤C、Pf=2n≤F,m,n≥0,进而使用Pc个MAC单元对该卷积层输入特征图进行不同输入通道之间的并行卷积计算,同时,针对每个输入通道均使用Pf个MAC单元对该卷积层不同输出通道之间的并行卷积计算; 所有P总个MAC单元均使用FPGA的DSP作为构建块,排列成Rof行得到乘加阵列,其中Pcmax为CNN所有卷积层中动态变化的Pc值中的最大值;对乘加阵列进行分级管理以自适应各卷积层Pc和Pf的动态变化,具体分级管理方法为: 1针对乘加阵列每行的每个MAC单元均设置一个选择器,作为第0层; 2对上一层设置的所有选择器按照相邻规则进行两两分组,对每组两个选择器设置一个加法器,加法器后跟随一个选择器;作为第i层; 3重复步骤2;当上一层仅有2个选择器时,对该2个选择器设置一个加法器; 4若0<Pc<Pcmax,则第log2Pc层之前的选择器控制其输入数据进入下一层的加法器进行计算,第log2Pc层的选择器控制其输入数据直接进行存储; 若Pc=Pcmax,则所有选择器均控制其输入数据进入下一层的加法器进行累加计算,且将最低层加法器的输出数据进行存储; Pc是指卷积层对输入特征图进行不同输入通道之间的并行卷积计算的并行度,Pf是指卷积层对不同输出通道之间的并行卷积计算的并行度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南师范大学,其通讯地址为:410081 湖南省长沙市岳麓区麓山路36号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励