浙江大学李渝获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于专家模块动态调度的MoE大模型推理优化方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120996204B 。
龙图腾网通过国家知识产权局官网在2026-01-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511488070.0,技术领域涉及:G06N5/04;该发明授权基于专家模块动态调度的MoE大模型推理优化方法及装置是由李渝;周游;卓成;尹勋钊设计研发完成,并于2025-10-17向国家知识产权局提交的专利申请。
本基于专家模块动态调度的MoE大模型推理优化方法及装置在说明书摘要公布了:本发明公开一种基于专家模块动态调度的MoE大模型推理优化方法及装置,涉及大模型推理优化技术领域。方法包括:根据对话文本数据集,通过MoE大模型进行预推理,获得第一评价得分集合;对GPU候选专家数量取值集,通过专家缓存命中率计算方法进行取值优化,获得GPU候选专家优化取值集;基于专家得分上升值‑传输专家数量的关系曲线进行CPU专家模块动态调度,获得CPU专家调度索引列表;根据第一评价得分集合和CPU专家调度索引列表进行GPU专家模块动态补充,获得GPU专家补充索引列表,并通过MoE大模型进行再推理,获得推理结果文本数据集。本发明是一种针对MoE大模型的平衡模型推理速度和输出结果质量的大模型推理优化方法。
本发明授权基于专家模块动态调度的MoE大模型推理优化方法及装置在权利要求书中公布了:1.一种基于专家模块动态调度的MoE大模型推理优化方法,其特征在于,所述方法包括: 将MoE大模型上传至计算机,读取当前的硬件资源状态,获得GPU专家索引列表、CPU专家索引列表和GPU候选专家数量取值集; 获取对话文本数据集;基于GPU专家索引列表以及GPU候选专家数量取值集,根据对话文本数据集,通过MoE大模型进行预推理,获得第一评价得分集合以及第一专家索引列表; 根据GPU专家索引列表以及第一专家索引列表,对GPU候选专家数量取值集,通过专家缓存命中率计算方法进行取值优化,获得第二专家索引列表、第三专家索引列表和GPU候选专家优化取值集; 基于专家得分上升值-传输专家数量的关系曲线,根据第一专家索引列表、第二专家索引列表、第一评价得分集合、CPU专家索引列表和GPU专家索引列表进行CPU专家模块动态调度,获得GPU未加载专家数量集以及CPU专家调度索引列表; 基于GPU未加载专家数量集,根据第一评价得分集合、第三专家索引列表和CPU专家调度索引列表进行GPU专家模块动态补充,获得GPU专家补充索引列表; 根据第二专家索引列表、CPU专家调度索引列表和GPU专家补充索引列表,获得调度后GPU专家索引列表;基于调度后GPU专家索引列表以及GPU候选专家优化取值集,根据对话文本数据集,通过MoE大模型进行再推理,获得推理结果文本数据集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310000 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励