Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于剪枝的多模型压缩部署方法、系统、介质及设备,属于人工智能模型压缩与边缘计算技术领域,所述方法为:分别提取各待部署模型的网络层拓扑关系,构建内部依赖图;迭代计算节点重要性分值,每轮剪除重要性最低且不在关键路径上的节点及边,...
  • 本公开属于人工智能技术领域,提供了一种基于TD3算法的智能体及训练方法,所述智能体为基于TD3算法构建,并结合自适应归一化和优先经验回放算法训练,用于生成连续策略的DRL模型;所述TD3算法包括双Critic网络、延迟更新和目标策略平滑;所...
  • 本公开涉及一种面向极少量样本的风电功率预测模型的训练方法及装置。包括:获取风电场的训练样本对,训练样本对包含的历史数值天气预报数据为不均衡的训练样本;利用训练样本对,迭代训练初始编码器,得到训练好的编码器,实现了利用无标签数据训练编码器,降...
  • 本发明公开了一种基于自我认知探索的网页智能体自适应学习方法及系统。本发明方法首先获取目标网页截图,由外部模型识别并标注可交互元素,初始化探索有向图并配置网页智能体;然后智能体实例化出选择器、预测器和判别器,通过多轮外层自更新与多步内层交互,...
  • 本发明提供了一种基于多目标结构化奖励函数的强化学习训练方法及系统,包括:环境模拟层包含物理引擎和血管环境模拟器,用于模拟导管在血管内的物理运动和交互,并提供环境状态给奖励计算层;奖励计算层通过多个独立的计算模块进行计算后最终通过复合奖励聚合...
  • 本申请公开了一种模型动态调度方法、设备、存储介质及程序产品,涉及人工智能的技术领域。在本申请中,通过构建包括融合信息以及在模型动态调度系统已集成模型中选取的目标模型的训练数据,对强化学习模型进行训练,进一步根据训练得到的强化学习模型利用实际...
  • 本发明涉及强化学习技术领域,提供了一种用于分布式并行强化学习的Web架构模型训练方法和装置。本发明每个训练节点分别训练相应的局部模型,并在完成预定轮数的训练后,将更新后的局部模型参数通过Web服务上传至融合服务节点;融合服务节点获取各个所述...
  • 本申请提供的船舶航线规划模型训练方法及相关装置中,电子设备获取船舶智能体当前的观测状态;其中,观测状态包括船舶智能体观测到的障碍物;根据观测状态,确定船舶智能体与障碍物之间的碰撞风险;通过船舶智能体对观测状态以及碰撞风险进行处理,得到针对观...
  • 本发明属于多智能体强化学习领域,公开了一种基于混合博弈的关系驱动多智能体强化学习方法及系统,策略网络生成智能体动作并交互环境以采集样本数据;集中式价值评估器基于样本计算智能体的边际影响值,推导出社交影响权重集合;基于权重将群体外部奖励分配为...
  • 本发明公开了一种用于具身导航决策理解的智能体训练方法,旨在解决现有技术中具身导航智能体因依赖单一路径模仿而导致的泛化能力和决策能力不足的问题。本发明的核心在于两大创新:a)一种新颖的训练数据集生成流程,该流程在智能体的每个决策点,为场景中所...
  • 本发明提出一种基于双Actor结构的可拓展分布式强化学习方法与系统,涉及人工智能与强化学习技术领域,其中,方法包括:初始化各智能体包含的双Actor网络,所述双Actor网络包含两个策略网络,分别为训练Actor与基线Actor,二者结构与...
  • 本发明公开了一种基于模型预测扩展的价值函数训练方法,步骤包括:Actor网络输入环境状态,通过神经代价映射输出代价参数,传递至末端集成的可微分MPC模块;可微分MPC模块在预测时域内求解凸二次规划问题,产生未来的预测状态、动作与奖励,传递至...
  • 本公开提供了一种基于无穷度量误差的智能体对抗鲁棒方法、装置及智能体,包括:初始化智能体的策略网络和价值网络;根据策略网络、价值网络和一致对抗鲁棒目标的软版本进行迭代,直到最大迭代次数,确定新的策略网络:在迭代更新策略网络后,智能体在对抗环境...
  • 本发明设计一种基于动态动量衰减的对抗攻击方法,旨在提高对抗样本在深度神经网络中的迁移性,从而实现对深度神经网络的攻击。该方法根据连续扰动之间的变化程度自适应调整动量系数,在攻击初期保持较强探索能力,在后期逐步增强扰动的稳定性,从而实现更合理...
  • 本申请公开了一种基于语义问答的模型训练方法、装置、设备及存储介质,涉及数据处理技术领域,公开了方法包括:构造原始样本对应的对抗样本;在将原始样本的问题文本信息和对抗样本的问题文本信息分别输入至待训练的语义问答模型中后,获取语义问答模型中每一...
  • 本发明涉及对抗攻击方法技术领域,公开了一种基于显著区域优化的稀疏对抗攻击方法,包括以下工作步骤:步骤一:显著区域提取,采用RMFormer模型对原始图像进行处理,确定图像的显著区域;步骤二:对显著区域图像进行高斯滤波等。本发明的稀疏对抗攻击...
  • 一种双阶段解耦的对抗鲁棒训练方法,属于对抗样本领域,包括:表征学习:设定类间隔,对真实类通道施加类间隔,采用类间隔损失计算本轮预测得分向量;进行延迟重加权;根据当前数据批次计算阶段一的损失函数并更新本轮模型参数,重复直到训练周期大于阶段分界...
  • 本发明属于多智能体强化学习领域,公开了一种基于合作博弈的对抗引导多智能体强化学习方法及系统,通过在集中训练框架中融合行为克隆预训练、生成式对抗模仿学习判别器及内在好奇心模型,构建自适应对抗探索机制提升多智能体协同效率。采用本方法同步攻克了三...
  • 本申请提供了一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,应用于云技术、人工智能、智慧交通、目标检测和数据分类等各种数据集压缩场景;该数据处理方法包括:基于待压缩数据集对第一待训练模型进行训练,得到目标数据处理模型,...
  • 本申请涉及数据处理技术领域,具体涉及一种模型训练方法、装置、设备及存储介质。该方法包括:获取第一模型的第一输入数据和第一输出数据;将第一输入数据作为第二样本输入数据输入第二模型,获取第二模型输出第二输出数据;基于第一输出数据和第二输出数据,...
技术分类