青岛国实科技集团有限公司丛明明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉青岛国实科技集团有限公司申请的专利基于国产神威处理器的pytorch移植方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119806638B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510307476.8,技术领域涉及:G06F8/76;该发明授权基于国产神威处理器的pytorch移植方法是由丛明明;陈溟;苏亮;马猛飞;信子君设计研发完成,并于2025-03-17向国家知识产权局提交的专利申请。
本基于国产神威处理器的pytorch移植方法在说明书摘要公布了:本申请涉及人工智能技术领域,特别是涉及基于国产神威处理器的pytorch移植方法,包括:在pytorch框架和神威处理器之间配置一架构适配层swMath,实现所述多个适配接口与pytorch框架的pytorch算子一一映射;识别pytorch框架中的高性能计算库,实现所述高性能计算库并基于神威处理器进行优化,得到优化后的高性能计算库后,整合为统一的动态链接库并与pytorch框架的libtorch.so库链接;在X86平台上使用针对神威处理器的交叉编译器sw‑gcc和sw‑g++编译CC++库文件代码,生成神威处理器可执行文件并在神威处理器上运行。通过本申请实现pytorch框架在神威处理器上的高效运行,提升深度学习任务的计算效率和性能。
本发明授权基于国产神威处理器的pytorch移植方法在权利要求书中公布了:1.一种基于国产神威处理器的pytorch移植方法,其特征在于,包括: 架构适配层搭建步骤,在pytorch框架和神威处理器之间配置一架构适配层swMath,所述架构适配层swMath设置有多个适配接口,为每个pytorch框架的pytorch算子定义一个对应的神威实现,实现所述多个适配接口与pytorch框架的pytorch算子一一映射,且所述适配接口被调用时可调用神威处理器进行算子运算; 高性能计算库移植步骤,识别pytorch框架中依赖CUDA平台的高性能计算库,实现所述高性能计算库并基于神威处理器进行优化,得到优化后的高性能计算库,所述优化后的高性能计算库包括基础数学运算库swBLAS、深度学习算子库swDNN及张量运算库swTensor,将所述基础数学运算库swBLAS、深度学习算子库swDNN及张量运算库swTensor整合为统一的动态链接库libswmath.so并将动态链接库libswmath.so与pytorch框架的libtorch.so库链接,所述高性能计算库指依赖CUPA平台进行并行计算的库,包括cuDNN和cuBLAS,cuDNN为深度神经网络提供高度优化的GPU加速函数,用于进行前向传播、后向传播计算,cuBLAS用于提供基本的线性代数运算的GPU加速实现; 编译适配步骤,在X86平台上使用针对神威处理器的交叉编译器sw-gcc和sw-g++编译CC++库文件代码,生成神威处理器可执行文件并在神威处理器上运行,利用CMake工具修改CMakeLists.txt增加交叉编译配置,实现在X86平台上交叉编译CC++库文件,并在神威平台上完成Python扩展模块的构建和注册,通过自动化脚本控制X86平台和神威平台之间的文件传输和编译过程,该自动化脚本使用scp传输文件,使用ssh远程执行命令,在X86平台上运行该自动化脚本,由其负责将源代码传输到神威平台,并执行CMake和编译命令,一旦编译成功,直接在神威平台上运行; 所述高性能计算库移植步骤进一步包括: 深度学习算子库优化步骤,将输入数据和权重数据分成多个数据块后执行运算操作,并将深度学习算子库swDNN中的计算密集型算子的运算操作划分为多个运算子任务,每个子任务独立的在神威处理器的从核上并行执行。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人青岛国实科技集团有限公司,其通讯地址为:266000 山东省青岛市即墨市凤凰路以西、创业路以南;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。