香港科技大学(广州)马牧雷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉香港科技大学(广州)申请的专利一种基于分布式大语言模型的任务调度方法、装置、终端设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120179359B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510256770.0,技术领域涉及:G06F9/48;该发明授权一种基于分布式大语言模型的任务调度方法、装置、终端设备及存储介质是由马牧雷;杨旸设计研发完成,并于2025-03-05向国家知识产权局提交的专利申请。
本一种基于分布式大语言模型的任务调度方法、装置、终端设备及存储介质在说明书摘要公布了:本发明公开了一种基于分布式大语言模型的任务调度方法、装置、终端设备及存储介质,上述方法包括:获取分布式大语言模型的多层网络中各设备节点的通信数据、待调度任务、待调度任务的任务特征、各设备节点的实时监测数据;随后根据所述通信数据、待调度任务、待调度任务的任务特征、各设备节点的实时监测数据,以多层网络的总延迟最小为目标对所述多层网络进行模型分割以及任务调度,得到各待调度任务对应的目标设备节点,并将各待调度任务分配至对应的目标设备节点进行调度。通过实施本发明,能实现对大语言模型内部多层网络的资源管理,提高了网络的性能,降低了延迟。
本发明授权一种基于分布式大语言模型的任务调度方法、装置、终端设备及存储介质在权利要求书中公布了:1.一种基于分布式大语言模型的任务调度方法,其特征在于,包括: 获取分布式大语言模型的多层网络中各设备节点的通信数据、待调度任务、待调度任务的任务特征、各设备节点的实时监测数据;其中,所述任务特征包括:任务算力、网络条件、任务大小以及算力需求;所述实时监测数据包括:计算能力、内存、带宽以及延迟; 根据所述通信数据、待调度任务、待调度任务的任务特征、各设备节点的实时监测数据,以多层网络的总延迟最小为目标对所述多层网络进行模型分割以及任务调度,得到各待调度任务对应的目标设备节点,并将各待调度任务分配至对应的目标设备节点进行调度;其中,以多层网络的总延迟最小为目标对所述多层网络进行模型分割以及任务调度时,所对应的第一目标函数为: 式中,表示总延迟,L表示层级总数,l表示第l层级,表示第l层级的传输延迟,表示第l层级的计算延迟,表示第l层级的设备节点,表示第l层级的设备节点总数,表示第层级的设备节点,表示第层级的设备节点总数,表示调度任务是否从l层级调度到层级,表示第l层级的计算需求分配系数,表示计算需求,表示第l层级中设备节点的计算能力,表示第l层级模型大小分配系数,表示模型大小,表示节点u的可实现传输速率,表示子信道k的带宽,表示传输信号干扰噪声比,表示第l层级的干扰加噪声功率,表示同一子信道集中其他用户g对第层级节点的干扰,表示层级l’与层级l之间的传输信号干扰噪声比,表示从第l层级节点到第l’层级节点的信道增益,表示第l层节点到节点的传输功率; 其中,根据所述通信数据以及分支定界的整数线性规划算法进行模型分割,得到各层级的分配方案;所述分配方案包括:模型大小以及计算需求; 根据所述分配方案将各待调度任务分配至各层级,得到各层级对应的目标待调度任务; 根据所述目标待调度任务、所述目标待调度任务对应的目标任务特征、所述实时监测数据,以及预设任务调度模型,以调度成本以及违反计算能力约束之和最小为目标进行任务调度,得到各待调度任务对应的目标设备节点;其中,所述调度成本以及违反计算能力约束之和,根据所述实时监测数据计算得到。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人香港科技大学(广州),其通讯地址为:511400 广东省广州市南沙区笃学路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励