浪潮云洲工业互联网有限公司张文强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮云洲工业互联网有限公司申请的专利一种基于边缘设备的大模型运行方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120196449B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510668615.X,技术领域涉及:G06F9/50;该发明授权一种基于边缘设备的大模型运行方法、装置、设备及介质是由张文强;齐光鹏;商广勇;罗涛;徐伟设计研发完成,并于2025-05-23向国家知识产权局提交的专利申请。
本一种基于边缘设备的大模型运行方法、装置、设备及介质在说明书摘要公布了:本申请公开了一种基于边缘设备的大模型运行方法、装置、设备及介质,涉及人工智能技术领域,包括:对待运行大模型进行预处理,并基于边缘设备的硬件特性对预处理后的待运行大模型进行优化;基于当前边缘设备的资源情况,确定优化后模型对应的待执行任务的任务优先级;根据任务优先级将待执行任务分配至预先搭建的模型协同运行框架中,并在分配的过程中,对待执行任务进行分析,以根据分析结果将待执行任务部署至模型协同运行框架的负载均衡节点上;利用预设数据缓存管理算法对相关参数数据进行管理,以将相关参数数据中待使用数据预加载至边缘设备中,以便优化后模型通过模型协同运行框架的负载均衡节点,基于待使用数据执行相应的待执行任务。
本发明授权一种基于边缘设备的大模型运行方法、装置、设备及介质在权利要求书中公布了:1.一种基于边缘设备的大模型运行方法,其特征在于,包括: 对待运行大模型进行预处理,并基于边缘设备的硬件特性对预处理后的所述待运行大模型进行优化,以得到优化后模型; 基于任务类型权重、任务优先处理需求权重、紧急程度权重以及资源依赖程度权重计算所述优化后模型对应的待执行任务的任务优先级; 根据所述任务优先级将所述待执行任务分配至预先搭建的模型协同运行框架中,并在分配的过程中,对所述待执行任务进行分析,以根据得到的分析结果将所述待执行任务部署至所述模型协同运行框架的负载均衡节点上;所述模型协同运行框架为由所述边缘设备、边缘服务器以及云端构建的框架; 利用预设数据缓存管理算法对运行所述优化后模型所需要的相关参数数据进行管理,以将所述相关参数数据中待使用数据预加载至所述边缘设备中,以便所述优化后模型通过所述模型协同运行框架的所述负载均衡节点,基于所述待使用数据执行相应的所述待执行任务;所述待使用数据为通过所述预设数据缓存管理算法预测到的在运行所述优化后模型的过程中,下一步需要使用的数据; 其中,所述利用预设数据缓存管理算法对运行所述优化后模型所需要的相关参数数据进行管理,以将所述相关参数数据中待使用数据预加载至所述边缘设备中,包括: 利用指数加权移动平均法计算运行所述优化后模型所需要的相关参数数据的数据访问频率,并确定所述相关参数数据的重要程度; 根据所述重要程度以及所述数据访问频率将所述相关参数数据缓存至目标缓存位置中;所述目标缓存位置包括内存缓存位置、闪存缓存位置以及云端缓存位置; 对所述目标缓存位置中的缓存数据进行特征提取和分析,以通过预设自回归移动平均模型预测所述缓存数据下一步的预测访问频率; 根据所述缓存数据存储在所述目标缓存位置的相关信息确定相应的缓存位置得分; 基于所述缓存位置得分、所述预测访问频率以及所述缓存数据的重要程度计算所述缓存数据的缓存价值,以根据所述缓存价值对所述缓存数据的缓存位置进行调整,同时利用预设用户行为模型输出的用户行为预测数据以及当前所述模型协同运行框架的状态确定所述缓存数据中的待使用数据,以将所述待使用数据预加载至所述边缘设备的所述内存缓存位置中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮云洲工业互联网有限公司,其通讯地址为:250101 山东省济南市高新区浪潮路1036号浪潮科技园S02号楼19层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。