Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于全局原型引导的联邦学习方法及系统,该方法包括:服务端向本地客户端发送全局模型和全局原型;本地客户端利用全局原型进行再平衡对比学习,并更新局部模型;本地客户端生成平衡对抗正原型实例集并再训练分类器;本地客户端计算局部原型并...
  • 本申请公开了一种模型分布式训练的方法、装置、设备及存储介质,应用于分布式集群中的管理节点;其中方法包括:获取分布式集群中的多个计算节点分别的多个资源状态数据;多个资源状态数据用于从不同维度反映计算节点的当前运行状态和性能;针对各计算节点,在...
  • 本发明涉及机器学习训练容错技术领域,公开了基于状态感知的LoRA训练容错方法。该方法包括通过传感器网络采集训练指标,构建时序知识库并自适应调整采样频率;利用历史数据生成状态变化趋势基线,通过偏离度比较初步识别异常。针对异常行为,融合其梯度频...
  • 本申请涉及一种多模态大语言模型微调方法、系统、设备及介质,属于人工智能与计算机视觉交叉技术领域,微调方法包括:获取原始业务场景图像并进行预处理,得到预处理图像;通过标注工具对预处理图像中的实体目标进行边界框坐标标注及语义标签定义,输出结构化...
  • 本申请公开了一种图神经网络增量更新的数据处理方法及系统,该方法包括:确定图神经网络的多个输出数据中的非合理数据;根据与非合理数据对应的数据血缘图谱,确定图神经网络中的多个候选优化节点和多个侯选优化边;根据图神经网络的结构参数确定各候选优化节...
  • 本公开提供了一种模型优化方法、程序产品及电子设备,涉及计算机技术领域。该方法包括确定待优化的多任务模型;根据当前批次数据,确定所述待优化的多任务模型中每个任务对应的门控权重;根据所述每个任务对应的门控权重进行多任务梯度协同优化处理,确定所述...
  • 本公开的实施例公开了基于大小模型协同的多模态大模型联合建模方法和装置。该方法的具体实施方式包括:基于公共数据集利用大模型对小模型进行蒸馏,确定出蒸馏后的小模型;将蒸馏后的小模型分别使用不同垂域的数据集进行训练,确定出不同垂域的小模型;将不同...
  • 本发明公开了一种多模态模型调整方法、设备、介质及产品。该方法包括:获取输入图像和文本数据;根据输入图像和文本数据生成输入向量;获取初始待调多模态模型,其中,初始待调多模态模型包括:目标网络层,所述目标网络层为待调网络层;将所述目标网络层对应...
  • 本发明公开了一种模型迁移学习方法、装置、设备、介质及计算机程序产品,所述方法包括:获取目标任务的特征数据,并根据语义类别对所述特征数据进行标注,得到语义标注数据;根据所述语义标注数据构建图结构,生成语义网络图结构;基于所述目标任务,对所述语...
  • 本申请涉及数据处理技术领域,具体涉及一种模型训练方法、装置、设备及存储介质。该方法包括:获取第一模型的第一输入数据和第一输出数据;将第一输入数据作为第二样本输入数据输入第二模型,获取第二模型输出第二输出数据;基于第一输出数据和第二输出数据,...
  • 本申请提供了一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,应用于云技术、人工智能、智慧交通、目标检测和数据分类等各种数据集压缩场景;该数据处理方法包括:基于待压缩数据集对第一待训练模型进行训练,得到目标数据处理模型,...
  • 本发明属于多智能体强化学习领域,公开了一种基于合作博弈的对抗引导多智能体强化学习方法及系统,通过在集中训练框架中融合行为克隆预训练、生成式对抗模仿学习判别器及内在好奇心模型,构建自适应对抗探索机制提升多智能体协同效率。采用本方法同步攻克了三...
  • 一种双阶段解耦的对抗鲁棒训练方法,属于对抗样本领域,包括:表征学习:设定类间隔,对真实类通道施加类间隔,采用类间隔损失计算本轮预测得分向量;进行延迟重加权;根据当前数据批次计算阶段一的损失函数并更新本轮模型参数,重复直到训练周期大于阶段分界...
  • 本发明涉及对抗攻击方法技术领域,公开了一种基于显著区域优化的稀疏对抗攻击方法,包括以下工作步骤:步骤一:显著区域提取,采用RMFormer模型对原始图像进行处理,确定图像的显著区域;步骤二:对显著区域图像进行高斯滤波等。本发明的稀疏对抗攻击...
  • 本申请公开了一种基于语义问答的模型训练方法、装置、设备及存储介质,涉及数据处理技术领域,公开了方法包括:构造原始样本对应的对抗样本;在将原始样本的问题文本信息和对抗样本的问题文本信息分别输入至待训练的语义问答模型中后,获取语义问答模型中每一...
  • 本发明设计一种基于动态动量衰减的对抗攻击方法,旨在提高对抗样本在深度神经网络中的迁移性,从而实现对深度神经网络的攻击。该方法根据连续扰动之间的变化程度自适应调整动量系数,在攻击初期保持较强探索能力,在后期逐步增强扰动的稳定性,从而实现更合理...
  • 本公开提供了一种基于无穷度量误差的智能体对抗鲁棒方法、装置及智能体,包括:初始化智能体的策略网络和价值网络;根据策略网络、价值网络和一致对抗鲁棒目标的软版本进行迭代,直到最大迭代次数,确定新的策略网络:在迭代更新策略网络后,智能体在对抗环境...
  • 本发明公开了一种基于模型预测扩展的价值函数训练方法,步骤包括:Actor网络输入环境状态,通过神经代价映射输出代价参数,传递至末端集成的可微分MPC模块;可微分MPC模块在预测时域内求解凸二次规划问题,产生未来的预测状态、动作与奖励,传递至...
  • 本发明提出一种基于双Actor结构的可拓展分布式强化学习方法与系统,涉及人工智能与强化学习技术领域,其中,方法包括:初始化各智能体包含的双Actor网络,所述双Actor网络包含两个策略网络,分别为训练Actor与基线Actor,二者结构与...
  • 本发明公开了一种用于具身导航决策理解的智能体训练方法,旨在解决现有技术中具身导航智能体因依赖单一路径模仿而导致的泛化能力和决策能力不足的问题。本发明的核心在于两大创新:a)一种新颖的训练数据集生成流程,该流程在智能体的每个决策点,为场景中所...
技术分类