Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及一种基于三支决策的智能模型分割方法,属于边缘计算技术领域。所述方法包括:获取环境状态、设备状态和任务清单并建模;按传输负载确定候选分割位置,结合任务时限与设备能耗对设备组合进行筛选,得到模型分割策略候选集;根据时延、计算负载、排队...
  • 本申请提供一种并行计算方法、装置、设备、介质及程序产品,涉及数据处理领域,用于提升多重网格算法中的并行计算效率。该方法包括:根据多重网格空间中三维区域对应的初始三维数组,获取关于各高度层的二维临时数组,基于多个二维临时数组各自对应的处理单元...
  • 本申请提供一种数据处理方法、装置、电子设备、存储介质及程序产品,涉及信息技术领域,用于提升数据资源评估的准确性与可靠性。该方法包括:采集目标实体基础成本指标、质量指标、应用指标以及资源关系指标多个维度的数据资源指标参数,通过目标资源模型对基...
  • 本申请涉及人工智能大模型技术领域,具体公开了一种面向异构集群的混合专家并行优化方法及应用其的装置,通过感知硬件特性与模型计算特征,构建动态自适应的训练框架,实现训练效率与资源利用率的最大化。其中,通过构建任务与GPU的多维特征画像,实现计算...
  • 本发明涉及云计算技术领域,具体提供了一种容器环境下显卡资源动态虚拟化的方法及装置,具有如下步骤:S1、部署基础容器环境;S2、安装显卡驱动;S3、增加显卡虚拟化配置文件gpu‑profile.yaml;S4、安装容器引擎插件;S5、部署容器...
  • 本申请涉及硬件仿真加速器多用户访问方法、系统、设备及存储介质,应用在硬件仿真加速器技术领域,方法包括在硬件仿真加速器中为不同用户分配若干资源块得到用户资源块对应表;在主机接口卡中虚拟化若干PCIe设备得到互相独立的若干虚拟功能设备;在主机服...
  • 本发明提供了一种任务调度执行方法、装置、计算机设备和存储介质,该方法包括:获取外部系统提交的任务请求,任务请求携带多个目标地址和多个漏洞载荷;根据多个目标地址和多个漏洞载荷生成多个子任务,并将多个子任务的子任务信息写入任务信息表中;通过多进...
  • 本发明公开了基于大模型训练的异构算力AI预测调度方法、系统、设备及介质,属于异构算力资源调度与人工智能训练技术领域,本发明要解决的技术问题为如何提高异构算力资源的整体利用率,加速大模型训练与推理任务的执行效率,克服现有技术因缺乏精准预测而导...
  • 本发明公开了分布式智能并行推演引擎的弹性资源编排方法及系统。该方法包括以下步骤:基于分布式仿真推演系统中各仿真进程各仿真时段内产生的仿真推演数据动态负载预测得到的各仿真进程各后续仿真时段的预测负载状态参数进行时段动态标记;基于时段动态标记结...
  • 本申请实施例提供一种任务处理方法和计算设备,该方法包括:获取处理任务,处理任务中包括目标应用信息;根据映射关系和目标应用信息,确定处理任务对应的目标内存分配比例,映射关系包括多个应用信息、以及每个应用信息对应的内存分配比例,内存分配比例为计...
  • 本发明属于人工智能领域,具体涉及了一种基于知识令牌的内存管理方法、装置及存储介质,旨在解决由于知识令牌的存储限制,难以在单张GPU上部署大规模知识增强模型的问题。本发明方法包括:获取知识库中存储的知识单元;将知识单元进行编码,获得初始知识令...
  • 本申请公开了一种低内存开销的JSON处理方法,包括:根据需构建的JSON字符串的节点数量,执行一次内存申请操作,将预处理数据写入节点,得到JSON的结构关系;遍历结构关系得到所需内存大小,根据所需内存大小,执行一次内存申请操作,将结构关系的...
  • 本发明属于资源调度优化技术领域,提供了一种基于闲置资源的分布式AI推理方法及系统,方法可以持续监测资源池中的终端节点状态并更新状态信息,可以响应推理请求,从资源池中筛选出推理节点并向推理节点发送推理指令,使推理节点创建独立的推理环境,在推理...
  • 本发明公开一种基于时序历史分析的GPU动态内存资源管理方法及系统。所述方法通过拦截深度学习模型运行时的CUDAAPI函数,生成包含内核执行顺序、内存块大小和地址的执行历史表。通过比较最新的两个执行历史表,计算一致性比率以判断内存访问模式是否...
  • 本申请涉及算力调度领域,公开了一种基于人工智能的算力调度方法,包括以下步骤:S1.全维度数据采集:通过分布式感知节点采集硬件资源数据、任务运行数据、用户需求数据及异构算力特性数据;S2.数据处理与特征构建:对S1中采集的数据进行预处理,通过...
  • 本发明提供了一种模型的运行方法及装置、设备、介质、产品,方法包括:获取模型的模型信息,并根据模型信息从内存中分配多个缓存单元;其中,模型被编译为多个算子,每个算子对应一个或多个层,每个缓存单元具有对应的类型和状态,状态包括已占用和未占用;执...
  • 本申请提供一种矩阵乘法任务的分配方法、装置及电子设备,该方法包括:基于多核处理器的核心总数将待乘矩阵切分为多个数据块,并将每对数据块的乘法运算作为一个任务;获取多核处理器中每个核心的核心状态数据,核心状态数据包括当前负载、历史负载波动系数和...
  • 本发明公开了一种基于全同态加密的密态向量‑明文矩阵乘法的GPU加速方法及应用,属于信息安全技术领域;通过将密文与明文的乘法转化至基上执行,消除了基和基之间冗余的基转换,及基转换前后的冗余NTT,由于明文矩阵被编码至基上,大幅降低了明文矩阵的...
  • 提供了一种资源调整方法、资源调整装置以及计算设备。该资源包括推理实例组和训练实例组,推理实例组用于通过AI模型处理第一输入数据得到响应数据,训练实例组用于根据经验数据更新AI模型的模型参数,其中,经验数据是根据响应数据得到的,且经验数据存储...
  • 本申请涉及无服务器架构领域,尤其涉及一种无服务器冷启动调度方法、该方法包括:将历史数据输入冷启动预测模型的输入,预测得到下一周期启动的函数实例集合;采集当前周期中的集群上每个节点的资源使用率,以构建长时间序列的节点资源数据;以最小化适应度为...
技术分类