无锡江南计算技术研究所吴铁彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉无锡江南计算技术研究所申请的专利一种支持多种不同精度运算的脉动阵列硬件实现方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115329939B 。
龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211017844.8,技术领域涉及:G06N3/049;该发明授权一种支持多种不同精度运算的脉动阵列硬件实现方法及装置是由吴铁彬;陈正博;王硕;谭弘兵;邱诗凯设计研发完成,并于2022-08-24向国家知识产权局提交的专利申请。
本一种支持多种不同精度运算的脉动阵列硬件实现方法及装置在说明书摘要公布了:本发明提供一种支持多种不同精度运算的脉动阵列硬件实现方法及装置,属于高性能微处理器设计技术领域。该方法包括如下步骤:S1:建立神经网络的阶段和运算配置相关联的关联表;S2:获取神经网络的阶段,从关联表中获取与该阶段对应的运算配置;S3:如果运算配置为混合精度浮点运算,则基于脉动阵列建立16*16bit+32bit定点浮点运算模型,基于16*16bit+32bit定点浮点运算模型进行混合精度浮点运算,如果运算配置为定点整形运算,则基于脉动阵列建立8*8bit+16bit定点运算模型,基于8*8bit+16bit定点运算模型进行定点整形运算。本发明充分挖掘降低精度的空间,提升处理吞吐率,提升脉动阵列运算性能,同时降低了不必要的硬件开销。
本发明授权一种支持多种不同精度运算的脉动阵列硬件实现方法及装置在权利要求书中公布了:1.一种支持多种不同精度运算的脉动阵列硬件实现方法,其特征在于,包括如下步骤: S1:建立神经网络的阶段和运算配置相关联的关联表; S2:获取神经网络的阶段,从关联表中获取与该阶段对应的运算配置; S3:如果运算配置为混合精度浮点运算,则基于脉动阵列建立16*16bit+32bit定点浮点运算模型,基于16*16bit+32bit定点浮点运算模型进行混合精度浮点运算,如果运算配置为定点整形运算,则基于脉动阵列建立8*8bit+16bit定点运算模型,基于8*8bit+16bit定点运算模型进行定点整形运算; 基于脉动阵列建立16*16bit+32bit定点浮点运算模型,基于16*16bit+32bit定点浮点运算模型进行混合精度浮点运算具体包括: 设立数据位宽为M*2B、精度为16bit、用以对输入特征图形的M个通道进行计算的第一西向数据处理器; 设立数据位宽为N*2B、精度为16bit、用以加载N个卷积核的第一北向数据处理器; 设立尺寸为M*N的第一脉动阵列; 设立第一南向数据处理器; 将第一西向数据处理器输出的数据和第一北向数据处理器输出的数据分别输入第一脉动阵列中进行混合精度浮点运算,第一脉动阵列将运算结果输入第一南向数据处理器,第一南向数据处理器得到具有N个通道、数据位宽位N*4B的第一输出特征图像; 基于脉动阵列建立8*8bit+16bit定点运算模型,基于8*8bit+16bit定点运算模型进行定点整形运算具体包括: 设立数据位宽为M*2B、精度为8bit、用以对输入特征图形的2M个通道进行计算的第二西向数据处理器; 设立数据位宽为N*2B、精度为8bit、用以加载2N个卷积核的第一北向数据处理器; 设立尺寸为M*2N的第二脉动阵列; 设立第二南向数据处理器; 将第二西向数据处理器输出的数据和第二北向数据处理器输出的数据分别输入第二脉动阵列中进行定点整形运算,第二脉动阵列将运算结果输入第二南向数据处理器,第二南向数据处理器得到具有2N个通道、数据位宽位N*2*2B的第二输出特征图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人无锡江南计算技术研究所,其通讯地址为:214100 江苏省无锡市滨湖区山水东路188号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励