Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种面向高并发直播的算力自适应负载均衡与能耗优化方法及系统。该系统包括算力监控模块、多层算力调度模块、动态迁移算法模块、能耗预测与优化模块以及任务优先级管理模块。通过算力监控模块实时采集服务器集群各节点的 CPU、GPU 与内存...
  • 本申请实施例提供了一种基于软硬协同的模型推理缓存管理方法,包括:用户端发送模型访问请求,执行推理计算,将新生成的键值缓存存储至显存缓存层;在显存缓存层中,更新各单元级键值缓存对应的访问热度,按访问热度从高到低排序,形成第一热度序列;更新各层...
  • 本申请公开了一种GPU资源动态分配方法、系统、设备及存储介质,涉及GPU资源管理技术领域,该方法通过实时采集资源状态信息和负载情况,使得能够精准掌握当前资源的使用情况,为资源分配提供准确依据。基于CUDA API的探测机制,能够准确判定任务...
  • 本申请公开了一种GPU算力动态调整方法、装置、设备及存储介质,涉及GPU计算资源管理技术领域,通过先获取GPU池内GPU设备的运行状态,然后基于GPU池内GPU设备的运行状态和预设的多维度扩缩容策略对GPU池内GPU设备的算力资源进行扩容或...
  • 本申请实施例提供了一种资源分配方法、装置及介质,所述方法包括:若确定m个任务同时请求同一目标GPU资源,管理节点获取m个任务中每个任务的优先级。任务的优先级与任务的任务执行时长、任务重要性以及任务截止时间中的至少一项相关。管理节点根据每个任...
  • 本发明公开了一种AI大数据实时处理与分析方法,解决传统处理中实时性不足、资源浪费问题。方法包括:多源采集异构数据,通过特征向量构建与动态评估模型划分优先级,分流至边缘快速处理、边缘‑云端协同及云端批量处理通道。边缘节点对高/中优先级数据预处...
  • 本申请公开了一种基于神经网络模型的测试资源分配方法、装置及电子设备, 涉及人工智能领域。其中,该方法包括:获取与N个外部系统相关的系统数据;从系统数据中提取多维特征向量;将多维特征向量输入至神经网络模型,通过神经网络模型依据多维特征向量确定...
  • 本申请提出一种动态调整处理器芯粒互连带宽的处理器与方法。所述处理器包括一第一芯粒、一第二芯粒、以及一工作负载监测器。该第一芯粒、以及一第二芯粒以一芯粒互连耦接。相应该工作负载监测器所监测到的工作负载信息,该第一芯粒动态调整该芯粒互连的带宽。
  • 本公开涉及一种应用于GPU集群的资源分配系统及方法、电子设备、存储介质和计算机程序产品,系统包括:负载调度器、拓扑调度器、GPU集群中每个GPU节点内部署的拓扑管理器;每个GPU节点内部署的拓扑管理器用于确定该GPU节点的设备拓扑图;负载调...
  • 本公开涉及一种多车型平台性能集成开发的协同管理方法和系统,属于车辆集成开发技术领域,所述多车型平台性能集成开发的协同管理方法通过获取历史与实时资源需求量,结合动态模型精准预测各车型不同时间段的资源需求,使资源分配更贴合实际开发的动态变化;基...
  • 本发明公开了一种面向AI模型训练的自动弹性算力扩缩容方法及系统。该方法通过采集训练指标与整体资源使用信息,结合轻量级预测模型生成资源需求曲线,并基于资源映射匹配度评分判定是否需要扩缩容。当检测到资源不足或过配时,系统依次执行训练微调、结构化...
  • 本申请涉及一种基于混合专家模型的任务执行方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域。本申请能够提升设备的计算利用率及计算效率。方法:确定分配到设备中每个专家的词元数量,根据该每个专家的词元数量得到设备中每个专家组的词元数量,...
  • 本申请实施例公开了一种缓存分配方法、装置、处理器、芯片以及电子设备,在该方法中,在通过多个处理单元各自的缓存访问信息,确定多个处理单元各自的缓存使用需求的情况下,可以通过多个处理单元各自的缓存使用需求,为多个处理单元分配各自对应的缓存,其中...
  • 本发明涉及云存储技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于负载与消息队列调控的迁移方法、装置、设备及介质,包括:采集源端与目标端负载指标生成负载状态信息,监测消息积压量与消费速率生成消息队列状态信息,基于两类状态信息生...
  • 本发明提供了一种智算平台资源调整方法、系统及存储介质,该方法包括:获取第一预设时长内智算平台的资源利用数据,并将组空间中的组标识与资源利用数据进行匹配,得到组资源数据;将所述用户节点的标识与组资源数据进行匹配,得到用户资源数据,并获取所述用...
  • 本发明公开了基于多核CPU的Linux用户态下保证硬实时的方法,属于嵌入式系统技术领域。该方法通过将Linux内核配置为完全可抢占模式,创建与CPU核数相等的用户线程并绑定至不同核,选定实时调度核并设置其线程调度策略为SCHED_FIFO且...
  • 本发明涉及算力调度技术领域,具体为基于大模型的智算中心GPU资源动态调度方法及系统。本发明中,通过深入分析Transformer大模型训练过程中各层权重矩阵的梯度数据,能够精准刻画不同计算任务在显存资源上的动态需求特征,同时结合监测各层激活...
  • 本申请涉及一种任务处理方法、装置、设备、存储介质和程序产品。所述方法包括:响应于针对集群中的边端设备的设备管控请求,调用请求标准化接口,对设备管控请求进行转换,得到标准管控请求;其中,请求标准化接口是通过对边端设备中类脑芯片架构和嵌入式架构...
  • 本发明公开了面向智慧城市的云资源自适应调度方法及系统,具体涉及云资源自适应调度技术领域,通过计算任务可迁移性误判系数精准识别出高风险任务,并对其标记进行深度风险控制;对高风险任务所拟迁移的候选节点计算节点资源伪可用系数;基于上述系数构建策略...
  • 本申请公开了一种共享存储器资源分配方法及装置,涉及芯片设计技术领域,包括基于初始的粒子的位置向量和速度向量,计算适应度值,更新个体最优适应度值和全局最优适应度值,继而确定第二位置向量和第三位置向量,再基于第二位置向量和第三位置向量,更新速度...
技术分类