Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国科学院计算机网络信息中心王彦棡获国家专利权

中国科学院计算机网络信息中心王彦棡获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国科学院计算机网络信息中心申请的专利一种面向国产超算系统的大模型训练优化方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119647559B

龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411583800.0,技术领域涉及:G06N3/098;该发明授权一种面向国产超算系统的大模型训练优化方法及装置是由王彦棡;唐雷;胡雨杭;周纯葆;王珏设计研发完成,并于2024-11-07向国家知识产权局提交的专利申请。

一种面向国产超算系统的大模型训练优化方法及装置在说明书摘要公布了:一种面向国产超算系统的大模型训练优化方法,应用于多个国产超算系统的计算设备,每个计算设备配置有GPU,GPU包含至少一个进程,方法应用于Megatron‑DeepSpeed框架,方法包括:确定大模型训练所需要的进程,每个进程确定归属的进程组;基于Megatron‑DeepSpeed框架中张量并行、流水线并行、数据并行的顺序,同时构建进程组,进程组中包括至少一个进程;每个进程在并行训练框架中执行多次前向计算和反向计算,通过进程组的通信机制进行数据交换与同步,前向计算和反向计算包括集合通信。本方法能够提高在国产超算上进行大模型训练时的训练效率。

本发明授权一种面向国产超算系统的大模型训练优化方法及装置在权利要求书中公布了:1.一种面向国产超算系统的大模型训练优化方法,其特征在于,应用于多个国产超算系统的计算设备,每个计算设备配置有GPU,GPU包含至少一个进程,所述方法应用于Megatron-DeepSpeed框架,所述方法包括: 确定大模型训练所需要的进程,每个所述进程确定归属的进程组; 基于所述Megatron-DeepSpeed框架中张量并行、流水线并行、数据并行的顺序,同时构建所述进程组,所述进程组中包括至少一个进程; 每个所述进程在并行训练框架中执行多次前向计算和反向计算,通过所述进程组的通信机制进行数据交换与同步,所述前向计算和反向计算包括集合通信,所述集合通信采用统一集合通信库UCC和统一通信X框架UCX。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算机网络信息中心,其通讯地址为:100190 北京市海淀区中关村南四街4号院内2号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。