Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京航空航天大学;南京航空航天大学深圳研究院陈志成获国家专利权

南京航空航天大学;南京航空航天大学深圳研究院陈志成获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京航空航天大学;南京航空航天大学深圳研究院申请的专利面向DSP平台的大尺寸二维卷积算子加速方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120409583B

龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510916708.X,技术领域涉及:G06N3/063;该发明授权面向DSP平台的大尺寸二维卷积算子加速方法是由陈志成;朱岱寅设计研发完成,并于2025-07-03向国家知识产权局提交的专利申请。

面向DSP平台的大尺寸二维卷积算子加速方法在说明书摘要公布了:本发明公开了一种面向DSP平台的大尺寸二维卷积算子加速方法,属于数字信号处理领域。该方法根据卷积类型选择im2col或col2im算法重排数据;采用三段矩阵分块策略适配L3缓存容量;利用EDMA缓冲乒乓架构,实现数据传输与计算的流水线并行;SIMD指令级优化,基于DMPYSP和DADDSP指令配合流水优化实现单周期4个FP32乘法运算和加法运算;多核并行调度,通过OpenMP实现任务级和数据级并行。该方法在TITMS320C6678平台实测可实现SAR目标检测网络的高效推理,为在DSP平台上CNN网络的实时推理提供可行方案。

本发明授权面向DSP平台的大尺寸二维卷积算子加速方法在权利要求书中公布了:1.一种面向DSP平台的大尺寸二维卷积算子加速方法,其特征在于,包括以下步骤: 1),动态数据重排:根据卷积类型选择im2col算法或col2im算法重排数据; 2),缓存管理策略:采用三段矩阵分块策略适配L3缓存容量; 3),利用EDMA缓冲乒乓架构,将计算与传输的流水线并行执行;具体包括: 缓存分配策略: 将三段矩阵分块策略分配在L3_Cache中的三段分块进行复制,得到大小和形状完全相同的两份三段缓存,分别称为缓存乒和缓存乓,后缀ping表示缓存乒,后缀pong表示缓存乓; 要求M_ping、N_ping和K_ping满足下面条件: M_ping*N_ping+K_ping*N_ping+M_ping*K_ping*sizeofdata_typeL3_Cache_Size*0.4; 其中,M_ping、N_ping和K_ping为子矩阵的维度,分别取值为M、N和K的因数;sizeofdata_type指矩阵元素的数据类型的大小,单位为字节;L3_Cache_Size指可供使用的L3缓存的大小,单位为字节; 同时M_pong、N_pong、K_pong和M_ping、N_ping、K_ping取值完全一致; EDMA与GEMM配合策略: 1按照三段矩阵分块策略选择输出矩阵、输入矩阵、权重矩阵的分块; 2选择缓存乒乓; 3EDMA从DDR传入分块的输入子矩阵和权重子矩阵到缓存乒乓; 4GEMM计算获得输出子矩阵; 5EDMA从缓存乒乓传出分块的输出子矩阵到DDR; 6若分块子矩阵没有遍历完,回到1,交换缓存乒乓,直到子矩阵遍历结束,完成整个矩阵的计算; 4),SIMD指令级优化,基于DSP的DMPYSP和DADDSP指令配合流水优化实现单周期4个FP32乘法运算和加法运算; 5),多核并行调度,结合OpenMP动态负载均衡技术实现多核并行加速。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学;南京航空航天大学深圳研究院,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。