Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 一种AI模型量化方法、装置及相关设备,涉及人工智能技术领域。将AI模型中的多个权重划分为第一权重集合以及第二权重集合,第一权重集合包括的重要权重对于量化的敏感度高于第二权重集合中的权重对于量化的敏感度;对AI模型中属于第二权重集合中的权重的...
  • 本申请提供一种模型稀疏方法、装置、电子设备和存储介质,属于计算机技术领域。其中,电子设备向原始模型中添加辅助参数,得到中间模型;辅助参数用于调节中间模型的精度。电子设备在述中间模型进行稀疏的过程中,调整辅助参数,得到目标模型。原始模型、中间...
  • 本申请实施例提供了一种神经网络模型的压缩方法、装置、设备和介质,其中的方法具体包括:针对待压缩的神经网络模型,生成混合超网;所述混合超网包括:可搜索单元;所述可搜索单元对应的配置参数包括:量化配置参数和网络结构配置参数;对可搜索单元的量化配...
  • 本申请提供了一种神经网络模型的权重数据处理方法、电子设备及存储介质,涉及机器学习技术领域,该方法包括:获取训练完成的神经网络模型的权重矩阵;根据权重矩阵中的最大权重值和最小权重值,确定权重矩阵的缩放因子和零点偏移量;基于缩放因子和零点偏移量...
  • 本发明公开了基于"赛马场"式多智能体对抗协同的生成模型、训练方法、系统及应用,通过模拟"赛马场"的优胜劣汰机制,构建了一个持续动态进化的智能体训练系统。系统维护一个由高水平智能体组成的"教师团",通过定期评估和末位淘汰机制,持续优化群体组成...
  • 一种基于文本概念表示的神经网络解释优化方法,针对特定数据集,首先以数据集信息和人类先验知识等为基础构建涵盖数据集类别显著外观特征的文本概念库,以此作为神经网络输入与输出之间的中间域,通过在文本概念空间映射得到神经网络的决策依据,实现对神经网...
  • 本发明涉及一种基于伯努利采样的可解释CNN训练方法、装置和介质,方法包括以下步骤:将图片输入CNN,获得滤波器的响应特征图;对响应特征图进行伯努利采样,得到二值化分配矩阵;依据二值化分配矩阵计算各个图片类别的滤波器平均权重矩阵,并计算成对差...
  • 本发明提供了一种准e进制神经网络模型和构造方法、数据处理方法、电子设备,所述准e进制神经网络模型包括输入层、隐藏层和输出层,所述输入层用于接收数据;所述隐藏层包括神经元,所述神经元中至少有一个子神经元,所述子神经元可表示为二值函数g(x)或...
  • 本申请涉及一种Winograd自动性能优化方法、装置、计算机设备以及存储介质。所述方法包括:选择基于NHWC数据排布格式的初始Winograd算法模板,并对所述初始Winograd算法模板进行流程优化,得到基于TensorGEMM+Batc...
  • 本发明涉及一种基于双支路跨注意力与时空联合建模的风场三维订正及不确定度预测方法,该方法首先获取数值天气预报模式输出的风场网格数据以及风场的点观测数据,得到每个观测点的观测数据,并为每条观测数据赋予一个质量权重;然后定义观测数据的观测算子;再...
  • 本发明公开了基于变分自编码的卫星红外多探元数据均一化方法,包括获取卫星大阵列红外探测仪的多通道观测亮温数据,构建变分自编码器模型,设计综合损失函数,采用动态权重调度机制,在训练过程中逐步调整各损失项的权重,采用Adam与分段学习率迭代训练,...
  • 本申请公开了一种大语言模型的训练方法、电子设备、存储介质及程序产品,涉及计算机技术领域。包括:将训练样本集中的目标训练样本输入待训练大语言模型,得到样本结果;训练样本集中的训练样本包括私域语料样本与通用语料样本,私域语料样本为与待训练大语言...
  • 一种面向大语言模型的长文本序列微调方法,包括:对长文本序列库中的长文本序列进行切分处理,形成记忆文本序列和局部文本序列;用大语言模型对记忆文本序列进行分段向量编码,得到记忆向量序列;将局部文本序列输入至大语言模型,得到大语言模型第一层局部向...
  • 一种使用神经网络模型的数据处理方法和用于执行该数据处理方法的电子设备,该数据处理方法可以包括:接收输入数据;基于输入数据在多个编码器之中选择用于对输入数据进行编码的编码器;通过使用所选择的编码器对输入数据进行编码来获得向量值;以及生成编码数...
  • 本申请提供一种模型处理方法、装置、设备及存储介质,可应用于模型编辑、间接宾语识别等场景。该方法包括:将训练数据输入第一模型中,对于第一模型所包括的N个注意力层中的每一个注意力层,基于该注意力层所包括的注意力头分别对应的扰动权重,对注意力头进...
  • 本申请提供了一种模型压缩方法、电子设备及存储介质,该方法包括:先获取待压缩的第一模型,其中,第一模型包括多个注意力层,每个注意力层包括多个注意力头,然后确定这些注意力层中每个注意力头分别对应的平均注意力距离,接着再基于平均注意力距离对注意力...
  • 一种水声学物理神经网络构建方法,属于水声物理与人工智能交叉领域。其核心在于利用水声波在介质中的物理传播过程直接实现神经网络计算。包括水声学传感器阵列部署、多层物理映射架构构建和混合训练机制实现;部署声源与N层物理级联系统采集声学信号及环境参...
  • 本申请实施例提供了一种模型训练方法、装置及相关产品,涉及机器学习技术领域。该模型训练方法不仅能够从开源数据集中选取与目标任务的第一样本数据高度相关的数据作为第二样本数据,从而减少数据冗余、提高数据质量、增强模型的训练效果,还能够基于与目标任...
  • 本申请提供一种基于模型的数据处理、模型推理加速的方法及设备。本申请的方案,通过在机器学习模型原有参数上插入扩展参数得到目标模型,且插入的扩展参数不改变机器学习模型的原有参数的推理结果。在推理时,通过目标模型的原有参数推理获得输入数据的特征表...
  • 本说明书实施例提供一种模型处理方法及装置。该方法包括:获取待处理的混合专家生成模型;所述混合专家生成模型包括集成有至少两个生成子模型的生成模型,每个生成子模型用于处理不同的生成任务;将所述混合专家生成模型的训练特征输入到低秩自适应矩阵,由所...
技术分类