Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取用于对目标模型进行红队测试的攻击行为信息,将上述攻击行为信息输入到策略生成模型中,生成攻击行为信息对应的一个或多个不同的攻击策略,然后,可以基于生成的攻击策略,通过预先训练...
  • 本发明涉及人工智能技术领域,具体公开了一种面向动态动作空间的校准终身强化学习方法及系统。方法包括当检测到动作空间变化时,自动归档历史经验数据至离线缓冲区并保留网络参数;通过在线与离线缓冲区的混合采样策略获取训练数据;在价值函数更新中引入基于...
  • 本发明公开了一种多智能体协同的强化学习方法、装置、设备、介质和产品。该方法包括:根据多智能体历史动作参数构建经验池,从经验池中选取目标经验数据,根据目标经验数据和多智能体协同网络确定多智能体的下一步执行策略参数;根据多智能体的下一步执行策略...
  • 本发明涉及人工智能与强化学习技术领域,具体为一种基于TensorBoard日志驱动与大模型服务的强化学习训练参数自动化调优系统及方法,系统包括:数据采集模块,日志解析模块,大模型服务模块,强化学习调参模块,反馈优化模块,多模态日志融合解析单...
  • 本发明公开了一种基于协同靶网络的多智能体协同探索方法与系统,旨在解决多智能体合作探索中因稀疏奖励导致的探索效率低下,以及随机网络蒸馏难以适配多智能体场景的问题。该方法在连续空间中构建协同探索环境,通过设计与智能体数量匹配的协同靶网络,使每个...
  • 本发明公开了一种基于复合奖励函数的作业车间调度深度强化学习方法,本发明通过设置作业车间调度问题参数,包括工件数、机器数及各工件工序加工时间;接着构建强化学习环境,设计包含工件、工序、机器多维度信息的调度状态s(t),定义动作与工件号、工序号...
  • 本申请提供了一种多智能体强化学习方法及无人机协同任务处理系统,包括:所有智能体根据当前所有UAV共享的策略网络进行数据采集,并行与仿真环境交互,记录下每个决策步的经验数据;基于共享奖励,使用广义优势估计方法计算出优势估计值;使用评论网络访问...
  • 本发明公开了一种基于人形机器人强化学习的数据增强方法,包含以下步骤:步骤S1:并行训练环境搭建;步骤S2:并行训练;步骤S3:训练数据获取;步骤S4:数据增强;步骤S5:训练任务loss计算;步骤S6:策略更新。本发明提出了一种人形机器人强...
  • 本发明公开了面向强化学习对齐的多样性保持监督微调方法,具体涉及大语言模型监督领域,包括以下步骤:步骤一:监督微调模型的构建;步骤二:奖励模型的构建;步骤三:结合强化学习优化。本发明重新设计或扩展CE目标,使其既能保持对齐,又能显式鼓励保留多...
  • 本发明提供基于多模态对比学习的工业认知基座系统及执行方法,其中所述基于多模态对比学习的工业认知基座系统通过构建包含知识图谱管理模块和跨模态编码融合模块的系统架构,将工业领域知识以结构化子图谱的形式动态注入多模态特征学习过程,并结合引入工业语...
  • 本发明公开了一种用于自动驾驶的大型感知模型训练框架和自动驾驶系统,该训练框架融合自监督学习机制,通过多任务自监督预训练模块构建多任务自监督预训练目标,引导模型在无标签场景下主动学习环境数据的潜在结构与语义表示,以提升感知模块对复杂环境与域间...
  • 本申请提供一种模型训练方法、VSP波场分离方法、装置及介质,涉及油气勘探领域。获取VSP样本数据,构建第一深度稀疏自编码网络,并获取VSP样本数据表示的不同波场呈现的梯度特征,根据梯度特征对VSP样本数据进行波场分离,得到第二深度稀疏自编码...
  • 本发明提供了一种智能决策模型的训练方法、装置、电子设备及介质,涉及人工智能技术领域,包括:获取目标车辆的驾驶人员的身份信息,并基于驾驶人员的身份信息,获取驾驶人员的驾驶偏好信息;获取目标车辆的历史交通数据以及行车过程中的实时交通数据和实时行...
  • 本申请公开了一种基于增量梯度下降的模型训练方法、设备、可读存储介质及程序产品,涉及人工智能技术领域,该模型训练方法包括:通过数据回放模块根据历史任务数据分布特征对历史任务样本数据进行筛选,生成历史分布特征样本数据;获取样本训练数据,混合历史...
  • 本发明公开了一种基于通道贡献度的批归一化掩码剪枝防御方法,属于人工智能安全与深度学习模型防护技术领域。该方法针对现有防御技术在中毒攻击下模型鲁棒性不足、难以在少量干净样本条件下有效抑制后门的问题,通过触发器反演生成伪中毒样本,基于干净样本与...
  • 本发明公开一种模型权重处理方法、装置、设备、存储介质及产品,针对剪枝后的神经网络模型,先获取其包含权重稀疏度的目标稀疏信息;再基于预设的稀疏信息与存储格式对应关系,结合目标稀疏信息确定最优存储格式;最后基于最优存储格式,对剪枝后模型的权重进...
  • 本申请提供了一种面向边缘部署的神经网络轻量化方法、装置和电子设备,应用于神经网络技术领域。该方法包括:对原始网络模型进行剪枝操作,以去除冗余结构和参数;对剪枝操作后的原始网络模型中的关联参数进行合并;对合并后的原始网络模型中的部分运算单元的...
  • 本说明书实施例公开了一种模型训练方法,该方法采用样本图像,对待训练扩散模型生成用于描述该样本图像的摘要文本的能力进行训练,同时,采用用于生成该样本图像的样本提示文本,对待训练扩散模型生成该样本提示文本对应的目标图像的能力进行训练,而由于样本...
  • 本申请实施例公开了一种模型训练方法、多媒体资源生成方法、装置及计算机设备,该方法包括:获取多媒体特征和文本特征;在第一训练阶段,采用训练参数,基于所述文本特征、第一加噪后的多媒体特征集合和第一参考噪声特征集合对待训练的多媒体生成模型进行至少...
  • 本申请实施例提供了一种模型训练方法、装置、电子设备及存储介质,该方法包括:获取第一模型的词表,其中,所述词表中包括N1个第一词元,一个所述第一词元表示一个工具标识,N1大于或等于1;基于所述词表,对所述第一模型进行训练。这样,将工具知识(即...
技术分类