Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 合肥君正科技有限公司刘子航获国家专利权

合肥君正科技有限公司刘子航获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉合肥君正科技有限公司申请的专利一种基于NNA的1xN卷积的实现方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116957002B

龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210320413.2,技术领域涉及:G06N3/0464;该发明授权一种基于NNA的1xN卷积的实现方法是由刘子航设计研发完成,并于2022-03-29向国家知识产权局提交的专利申请。

一种基于NNA的1xN卷积的实现方法在说明书摘要公布了:本发明提供一种基于NNA的1xN卷积的实现方法,在不满足NNA相关参数范围时,通过对输入图像和卷积核矩阵进行拆分、重组、累加来实现NNA卷积加速,其中,卷积核拆分:对于1xN卷积,当N大于3时,超出了NNA寄存器参数范围,通过卷积核拆分实现NNA卷积加速;还包括NNA寄存器配置:使用NNA进行卷积加速必须正确配置NNA相关寄存器、卷积的步长、卷积核大小的必要参数都通过NNA寄存器进行配置,这些参数都必须在NNA支持的参数范围内才能得到正确的卷积结果。通过配置相关寄存器参数实现卷积核矩阵维度≤3x3的卷积计算加速,从而大幅度减少神经网络运行时间,在实际应用中实时性更高,用户体验更好。在不满足NNA相关参数范围时,保证通用性又能提高卷积运算速度。

本发明授权一种基于NNA的1xN卷积的实现方法在权利要求书中公布了:1.一种基于NNA的1xN卷积的实现方法,其特征在于,所述方法在不满足NNA相关参数范围时,通过对输入图像和卷积核矩阵进行拆分、重组、累加来实现NNA卷积加速,其中, 卷积核拆分:对于1xN卷积,当N大于3时,超出了NNA寄存器参数范围,通过卷积核拆分实现NNA卷积加速; 本方法还包括NNA寄存器配置:使用NNA进行卷积加速必须正确配置NNA相关寄存器、卷积的步长、卷积核大小、输入图像大小和数据位宽、FRAM和WRAM的读写地址、FRAM写地址跳转都通过NNA寄存器进行配置; 所述方法包括以下步骤: S1,输入图像大小IH*IW,卷积核矩阵大小KH*KW,输入图像边缘填充大小为pad_top,pad_bottom,pad_left,pad_right,卷积步长为stride_x,stride_y,输出图像的大小OH*OW通过以下公式计算: ; ; S2,NNA卷积过程:将卷积核数据写入WRAM,再将需要的输入图像数据写入FRAM,一次可写4或8个pixel,NNA硬件限制写入FRAM的pixel数目必须是4的整数倍;通过NNA硬件寄存器设置卷积核大小即KH和KW必须小于等于3、pad、stride、输入图像大小和数据位宽、FRAM和WRAM的读地址参数,再调用NNA硬件指令得到卷积结果输出,一次能够得到4个pixel的输出数据; 每次需要向FRAM写入的pixel数目为FP_H*FP_W: ; 其中FP_W需要对齐到4; S3,对于1xN卷积,当N≤3时,通过上述过程直接得到卷积结果;当N3时,由于NNA硬件寄存器参数范围限制,需要对卷积核矩阵进行拆分,具体实现为:卷积核大小1*NN3,NNA最大支持1*3的卷积核,将卷积核拆分为1*3,...,1*3,...,1*N%3多个卷积核,其中%表示取余数,拆分后卷积核的个数K为: ; 对前K-1个卷积核,需要向FRAM写入1*fp_w个pixel的输入数据,,fp_w需要对齐到4,通过配置NNA寄存器设置卷积核大小即1*3、pad、stride、输入图像大小和数据位宽、FRAM和WRAM的读地址参数,再调用NNA硬件指令得到4个pixel的输出数据,循环上述过程K-1次; 对最后一个卷积核即大小为1*N%3,需要向FRAM写入1*fp_w个pixel的输入数据,,fp_w需要对齐到4,通过配置NNA寄存器设置卷积核大小即1*N%3、pad、stride、输入图像大小和数据位宽、FRAM和WRAM的读地址参数,再调用NNA硬件指令得到4个pixel的输出数据,将此结果和前K-1次得到的结果进行累加,即将前K-1次得到的4个pixel数据和本次得到的4个pixel数据对应位置相加,便得到最终的1*N卷积输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥君正科技有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路800号创新园C3楼9层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。