Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供一种模型训练方法、VSP波场分离方法、装置及介质,涉及油气勘探领域。获取VSP样本数据,构建第一深度稀疏自编码网络,并获取VSP样本数据表示的不同波场呈现的梯度特征,根据梯度特征对VSP样本数据进行波场分离,得到第二深度稀疏自编码...
  • 本发明公开了一种用于自动驾驶的大型感知模型训练框架和自动驾驶系统,该训练框架融合自监督学习机制,通过多任务自监督预训练模块构建多任务自监督预训练目标,引导模型在无标签场景下主动学习环境数据的潜在结构与语义表示,以提升感知模块对复杂环境与域间...
  • 本发明提供基于多模态对比学习的工业认知基座系统及执行方法,其中所述基于多模态对比学习的工业认知基座系统通过构建包含知识图谱管理模块和跨模态编码融合模块的系统架构,将工业领域知识以结构化子图谱的形式动态注入多模态特征学习过程,并结合引入工业语...
  • 本发明公开了面向强化学习对齐的多样性保持监督微调方法,具体涉及大语言模型监督领域,包括以下步骤:步骤一:监督微调模型的构建;步骤二:奖励模型的构建;步骤三:结合强化学习优化。本发明重新设计或扩展CE目标,使其既能保持对齐,又能显式鼓励保留多...
  • 本发明公开了一种基于人形机器人强化学习的数据增强方法,包含以下步骤:步骤S1:并行训练环境搭建;步骤S2:并行训练;步骤S3:训练数据获取;步骤S4:数据增强;步骤S5:训练任务loss计算;步骤S6:策略更新。本发明提出了一种人形机器人强...
  • 本申请提供了一种多智能体强化学习方法及无人机协同任务处理系统,包括:所有智能体根据当前所有UAV共享的策略网络进行数据采集,并行与仿真环境交互,记录下每个决策步的经验数据;基于共享奖励,使用广义优势估计方法计算出优势估计值;使用评论网络访问...
  • 本发明公开了一种基于复合奖励函数的作业车间调度深度强化学习方法,本发明通过设置作业车间调度问题参数,包括工件数、机器数及各工件工序加工时间;接着构建强化学习环境,设计包含工件、工序、机器多维度信息的调度状态s(t),定义动作与工件号、工序号...
  • 本发明公开了一种基于协同靶网络的多智能体协同探索方法与系统,旨在解决多智能体合作探索中因稀疏奖励导致的探索效率低下,以及随机网络蒸馏难以适配多智能体场景的问题。该方法在连续空间中构建协同探索环境,通过设计与智能体数量匹配的协同靶网络,使每个...
  • 本发明涉及人工智能与强化学习技术领域,具体为一种基于TensorBoard日志驱动与大模型服务的强化学习训练参数自动化调优系统及方法,系统包括:数据采集模块,日志解析模块,大模型服务模块,强化学习调参模块,反馈优化模块,多模态日志融合解析单...
  • 本发明公开了一种多智能体协同的强化学习方法、装置、设备、介质和产品。该方法包括:根据多智能体历史动作参数构建经验池,从经验池中选取目标经验数据,根据目标经验数据和多智能体协同网络确定多智能体的下一步执行策略参数;根据多智能体的下一步执行策略...
  • 本发明涉及人工智能技术领域,具体公开了一种面向动态动作空间的校准终身强化学习方法及系统。方法包括当检测到动作空间变化时,自动归档历史经验数据至离线缓冲区并保留网络参数;通过在线与离线缓冲区的混合采样策略获取训练数据;在价值函数更新中引入基于...
  • 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取用于对目标模型进行红队测试的攻击行为信息,将上述攻击行为信息输入到策略生成模型中,生成攻击行为信息对应的一个或多个不同的攻击策略,然后,可以基于生成的攻击策略,通过预先训练...
  • 本发明公开一种基于语义扰动边界框的有针对性对抗攻击方法及系统,该方法中,定义扰动信号注入区域为干净图像内容区域之外的边界区域,边界区域的宽度为h;构建条件生成模型,包括编码器‑解码器生成网络、类别编码器和分类器网络,其中,类别编码器用于将目...
  • 本发明公开了一种基于对抗鲁棒插值与贝叶斯优化的神经网络模型融合方法,属于人工智能与深度学习模型安全防护技术领域。针对深度神经网络在白盒对抗攻击下鲁棒性与准确性难以兼顾以及现有方法在插值参数选择、Fisher信息估计和迭代优化方面的缺陷,本发...
  • 本申请公开了一种模型训练方法、装置、冰箱自主系统、电子设备和存储介质,属于电器技术领域,该方法包括:获取训练数据集;对教师模型进行预训练,教师模型为包括种子模型、节点模型和叶子模型的大语言模型;在预训练结束后,保存教师模型的参数;基于训练数...
  • 本申请涉及人工智能技术领域,公开了一种模型微调方法及电子设备,通过对预训练模型的原始权重矩阵进行低秩分解与秩优化以构造增量权重矩阵,对原始权重矩阵与所述增量权重矩阵进行组合以得到待训练模型,基于目标数据集与增量学习算法对待训练模型进行训练以...
  • 本申请公开了一种基于特定任务知识蒸馏的深度神经网络优化方法,该方法包括以下步骤:获取综合数据集、教师网络以及待优化的学生网络;在综合数据集上迭代训练教师网络;针对特定识别任务将数据集划分为特定目标类数据和背景干扰类数据;将教师网络的特定目标...
  • 本发明提出一种基于知识蒸馏的视觉大模型优化部署方法,涉及人工智能技术领域,该方案首先构建基准模型,基准模型包括骨干网络和基础基准网络,训练基准模型,将训练好的基准模型中的骨干网络替换为已预训练的Conformer网络,得到替换后的Confo...
  • 本发明提供了一种训练数据的生成方法、模型训练方法、文本数据的识别方法以及电子设备。本发明通过使用预设的指令模版结构化处理原始文本数据,并结合教师模型与学生模型的联合训练,生成混合知识数据集,能够有效提升学生模型的训练数据质量与知识继承能力。...
  • 本发明公开了一种基于混合专家结构的世界模型多任务学习优化方法,所属领域为多任务学习优化领域,包括:通过为各任务设置独立专家并结合门控层加权机制,避免了硬参数共享带来的跷跷板效应;通过在损失函数中引入同方差不确定性建模,动态调整不同任务损失权...
技术分类