Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京清微智能科技有限公司李俊文获国家专利权

北京清微智能科技有限公司李俊文获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京清微智能科技有限公司申请的专利一种用于CNN计算的脉动阵列重构方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117992376B

龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311758709.3,技术领域涉及:G06F13/28;该发明授权一种用于CNN计算的脉动阵列重构方法是由李俊文;崔云飞;欧阳鹏设计研发完成,并于2023-12-20向国家知识产权局提交的专利申请。

一种用于CNN计算的脉动阵列重构方法在说明书摘要公布了:本发明属于脉动阵列技术领域,具体公开了一种用于CNN计算的脉动阵列重构方法。该方法针对当前由ASIC来实现CNN的计算而采用脉动阵列矩阵的硬件结构存在的不足,提出了通过重排序和重映射输入特征数据和输入权重数据,实现了脉动阵列的可重构性,不仅能够兼容不同算子及不同特征图输入尺寸,并且有效地提高了MAC的利用率。

本发明授权一种用于CNN计算的脉动阵列重构方法在权利要求书中公布了:1.一种用于CNN计算的脉动阵列重构方法,其特征在于,包括步骤: 步骤S1,系统控制器M0收到加载指令后启动DMA模块,将特征数据和权重数据从外部存储器按照一定的排列顺序分别存放在FSPM和WSPM中,其中,FSPM中特征数据存放格式为HWC,其中,H为特征图高度,W为特征图宽度,C为特征图输入通道数,WSPM中权重数据存放格式为KyKxFC,其中,Ky为卷积核高度,Kx为卷积核宽度,F为输出通道数,C为输入通道数; 步骤S2,特征数据和权重数据加载完成后,系统控制器M0给PEA控制器M1发送启动计算指令,由脉动阵列控制器M1将特征数据和权重数据按照PEA的计算维度,从FSPM和WSPM中分别传输至脉动阵列内的BF和BW中,S2中所述的PEA是以基本处理单元PE为单位,并设计为2行8列的PE矩阵,每个PE包含8个独立的PEM,每个PEM包含16个乘法器和一个累加器,BF的最小组成单元为32个特征图输入通道,BW的最小组成单元为32个输入通道的特征图; 步骤S3,在BF和BW中执行特征数据和权重数据的重映射和重排序过程; 其中,步骤S3中所述的重映射过程,根据不同计算模式,对应的执行过程为: 当PEA计算模式为常规CNN卷积和Depthwise+8bit时,PEA结构为2行8列的PE矩阵,PEA纵向输入为8个16输入通道数的特征数据; 而当PEA计算模式为Depthwise+16bit时,Depthwise计算是特征数据的输入通道和权重的输出通道相乘,每个PE只能处理8输入通道数的数据,并且需要把BF中的4个16输出通道数的输出数据重新映射到8个PE的纵向特征输入寄存器中,每个PE的纵向特征输入寄存器中存放8输入通道数的数据; 步骤S3中所述的重排序过程,是PEA计算时首先按照输入通道数的维度,并以32输入通道数为单位进行特征数据和权重数据的累加乘,当输入通道数的维度轮询完成后,切换到下一个Kx维度,Kx维度轮询完成后,切换到下一个Ky维度,Ky维度轮询完成后,切换到下一组16输出通道数的维度; 步骤S4,特征数据和权重数据被排列成PEA计算所需的时序,并输送至PEA中进行卷积运算; 步骤S5,卷积运算计算完成后,其计算结果由PEA写回到FSPM中。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京清微智能科技有限公司,其通讯地址为:100080 北京市海淀区宝盛南路1号院26号楼2层201;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。