Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于尖峰缩放的针对脉冲神经网络的对抗样本生成方法,首先通过在隐藏尖峰层中定位对抗目标的响应目标层和目标神经元集合,精确地确定受害者模型中实现尖峰缩放的目标对象,然后在生成对抗样本的迭代优化过程中,将目标神经元的尖峰缩放作为附...
  • 本发明提供的基于动态调控的大语言模型安全保护防御方法和装置,属于人工智能安全防护领域。所述大语言模型安全保护防御方法通过构建非安全数据集、安全数据集合越狱提示数据集,计算各类数据集反向传播时大语言模型每一层参数的梯度平均值,计算各梯度间的余...
  • 本发明实施例公开了一种联邦学习方法、系统、设备及存储介质。该方法包括:在第t轮迭代中,接收各个客户端发送的第一目标子矩阵以及第二目标子矩阵;根据每个客户端对应的比例因子,对各个第一目标子矩阵以及各个第二目标子矩阵分别进行聚合,得到第一目标矩...
  • 本发明公开了一种基于多目标模因算法的自动对抗攻击方法,包括:从完整数据集中根据损失值排序后采样,挑选小型数据集用于粗略评估;初始化种群,生成包含多个随机攻击序列的初始种群,并使用小型数据集评估每个个体的鲁棒精度和耗时;通过交叉和变异操作生成...
  • 本发明公开了一种基于多保真评估的高效搜索综合鲁棒网络架构方法,包括:训练包含多个子网络架构的超网;从超网中采样子网络架构,采用多种鲁棒性评估手段计算模型的鲁棒精度,通过相关性分析合并相似类型的评估手段,获得缩减后的评估方式;从超网中采样子网...
  • 本发明涉及强化学习技术领域,解决了智能体进入数据集中未涵盖的OOD state时会陷入连续OOD轨迹,导致性能严重下降的技术问题,尤其涉及一种离线强化学习中主动避免OOD state的方法,旨在仅从一个固定的、预先存在的离线数据集学习一种有...
  • 本发明涉及人工智能与强化学习领域,具体提出一种基于动力学一致性约束的扩散离线强化学习规划方法。现有扩散模型虽能规划长时域轨迹,但轨迹中常存在动作可行性不足,部分采样动作在真实环境中难以执行并实现预期效果,导致计划轨迹与执行轨迹存在偏差。为解...
  • 本发明提供一种动态自适应强化学习模型的训练方法及系统,包括:步骤一:智能体知道在任何状态下执行任何动作所获得的回报,即R(Tn, sk)已知,在每个离散的时间步k=1,2,……n上,观察当前的状态Tn;步骤二:选择需要执行的动作sk,从而收...
  • 本发明公开了一种基于动态掩码注意力的多起点序列决策强化学习方法,包括以下步骤:获取杀伤网中的装备节点以及对抗环决策任务目标;将对抗环决策建模为具有决策空间的马尔可夫决策过程;采用动态掩码注意力模型学习马尔可夫决策过程中的最优策略,在注意力模...
  • 本申请公开了基于双向加权策略蒸馏的深度强化学习模型压缩方法,包括获取至少一教师模型,所述教师模型被训练为表现优异,能够用于指导学生模型的训练;所述学生模型为对应教师模型的压缩模型;对所述教师模型进行评估,获取所述教师模型的策略知识,并将所述...
  • 本公开提供一种强化学习系统的奖励生成方法及相关装置,涉及计算机技术领域。该方法为:对异构环境数据进行划分处理,获得多个维度数据和每个所述维度数据对应的异构信息;根据每个所述维度数据的异构信息,分别确定对每个所述维度数据进行奖励分析的目标神经...
  • 本发明提供一种智能体的中介策略的训练方法,包括以处理器执行:从多个策略中选择一源策略及一目标策略,其中每个策略用于驱动智能体执行多个动作以处于多个状态,每个状态包括多个物理属性。从源策略中及目标策略中的所述多个状态中各自选择一个作为源状态及...
  • 本说明书实施例提供模型训练方法以及平台、文本推理方法以及平台,其中所述模型训练方法包括:获取初始样本集、学生推理模型和学生推理模型的推理能力标签,其中,初始样本集包括多个样本思维链,多个样本思维链为教师推理模型采用不同的推理方法生成,任一样...
  • 本发明涉及自然语言处理领域,公开了一种金融语言模型训练方法、装置、计算机设备及存储介质,获取包含幻觉标注数据的第一金融样本数据;将第一金融样本数据输入多任务监督模型进行训练,获得已训练多任务监督模型;将第二金融样本数据输入已训练多任务监督模...
  • 本申请实施例提供了一种图文匹配模型的训练方法和装置、设备及介质,属于人工智能技术领域。该方法包括:通过图文匹配模型对每一图像样本和每一文本样本进行编码;从编码后所得的多个文本样本特征中将与图像样本特征的相似度最高的文本样本特征确定为最近邻文...
  • 本发明公开了一种改进的多目标遗传算法及其在涡轮叶片狭缝设计中的应用,该方法首先基于叶片狭缝的几何参数和温度泄漏流量数据建立快速预测代理模型,然后定义叶顶局部最高温度和泄漏流量作为优化目标,最后采用改进的 NSGA‑Ⅱ算法进行多目标优化,获取...
  • 一种基于可学习权重的Token级多模态模型量化方法,包括步骤:将满足模态一致性要求的校准样本输入Token级敏感度模型,生成用于表示Token相对重要性的Token级敏感度评分;根据校准样本输入多模态模型获取的未量化浮点输出和伪量化输出,生...
  • 本发明涉及大模型算法技术领域,尤其涉及一种基于稀疏化剪枝的大模型动态压缩优化方法及系统,该方法捕获推理中因资源波动产生的原始权重波动数据,经稀疏化处理得到稀疏权重基准数据;通过模型推理延迟数据解析计算复杂度,分离出模型规模导致的推理延迟量;...
  • 本发明涉及深度学习技术领域,尤其涉及一种基于强化学习的动态聚类通道剪枝方法,利用训练图像对经典分类网络进行预训练,得到预训练网络模型;统计预训练网络模型的特征多频响应,构建通道级的网络状态表示;以网络状态表示为顶点构建超图,并利用超图卷积进...
  • 提供了一种用于修改用于处理多媒体数据的深度学习模型的架构的方法和神经处理器。本公开涉及用于修改深度学习模型的架构的自动化方法,以基于在片上系统(SoC)中执行的深度学习模型来提高推断性能。所述用于修改深度学习模型的架构的示例方法包括:在包括...
技术分类