Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开一种基于动态阈值与知识蒸馏的金融风控模型净化方法和系统,方法包括,检测目标风控模型是否受到攻击;响应于确定目标风控模型受到攻击,计算目标风控模型的训练数据的影响函数值,以根据影响函数值在目标风控模型的训练数据集中定位恶意训练数据;...
  • 本发明的一种基于统一强化学习的遥感视觉语言大模型训练方法及装置,属于人工智能与遥感影像处理技术领域,方法包括步骤:对输入的遥感影像和文本指令进行预处理,提取视觉特征和文本特征;进行模态对齐后输入到预训练的大语言模型中进行有监督指令微调,得到...
  • 本发明涉及一种基于进化神经架构搜索与强化学习的因果结构发现方法,包括:获取待检测的观测数据,将待检测的观测数据输入因果结构检测模型,获取最高置信度边组成的有向无环图;因果结构检测模型利用训练集训练Actor‑Critic模型获得;Actor...
  • 本申请提供一种大语言模型训练方法、装置、存储介质及电子设备,涉及计算机技术领域,方法包括:获取目标提示词;将目标提示词输入至训练好的策略模型,得到策略模型输出的目标提示词对应的回复;其中,策略模型是利用改进直接偏好优化方法,基于多个样本提示...
  • 本发明提出一种基于值分布的融合Reformer模型的多智能体分布式强化学习发电控制方法、装置、计算机设备及介质,该方法首先获取新型电力系统的频率偏差并注入观测模块计算频率偏差多维度特征,采用基于通过基于局部敏感哈希注意力的Reformer模...
  • 本发明公开了一种基于模型的自适应光学动态建模与控制方法及装置,属于自适应光学与基于模型的强化学习交叉领域,包括步骤:将AO系统状态定义为多模态观测的组合,并进行相应编码;通过交叉注意力机制将多模态观测数据进行融合,形成统一且富含动态信息的观...
  • 本发明公开了一种动态边缘网络中分层联邦学习的图强化学习用户选择与资源分配方法,核心是将图神经网络(GNN)的拓扑感知能力与深度强化学习(DRL)的序列决策能力相结合,以高效地完成每轮联邦学习的用户选择。
  • 本发明公开了一种基于并行强化学习的异构资源协同优化方法,该方法包括:将异构资源分配问题形式化为马尔可夫决策过程,定义状态空间、动作空间、奖励函数以及状态转换机制,并构建基于Q学习的动态决策模型;根据任务目标的类型,将任务目标和异构资源进行分...
  • 一种受项目反应理论启发的场景驱动式自动驾驶强化学习方法。首先,通过整合三种不同危险程度现实驾驶场景生成的方法得到多阶段不同难度的驾驶场景并在模型训练过程中不断调整场景的难度,形成多场景学习方法。接着,基于项目反应理论(IRT)和环境参数化模...
  • 本发明属于无人艇智能控制与强化学习优化相关技术领域,具体涉及一种基于加速减速策略的无梯度强化学习方法,包括:将原始高维参数搜索空间降低到一个有效低维参数搜索空间,评估该有效低维下优化结果的质量,若不满足,则增加有效低维的维度,直至确定一个满...
  • 本发明涉及一种提高强化学习拦截策略鲁棒性的补差训练方法,包括:获取均势对抗交战场景,利用一阶延迟动力学模型描述均势对抗交战场景,并将均势对抗交战场景中的防御导弹制导过程定义为马尔可夫决策过程;在马尔可夫决策过程的基础上,基于课程学习方式利用...
  • 本申请公开了一种用于量化交易的可推理决策模型训练方法以及计算机设备,属于计算机技术领域。通过本申请实施例提供的技术方案,在对决策模型进行任一轮的训练过程中,获取本轮训练样本数据。利用该样本数据和该决策模型,确定不少于两个的目标推理尺度,基于...
  • 一种训练嵌入模型的方法及装置,嵌入模型包括对应于多个文本粒度的多个网络层集,各网络层集的若干网络层均包括注意力模块,方法包括:确定第一输入文本的第一词元序列和对应于各文本粒度的掩码矩阵,与第一文本粒度的第一网络层对应的掩码矩阵:指示第一网络...
  • 本发明公开了一种基于LoRA‑MoE的动态路由参数高效微调方法及系统,涉及大模型微调技术领域。首先,基于多领域数据集构建基于异构专家架构的LoRA模块池。其次,通过动态门控网络对任务隐层特征进行编码,实现连续可微的专家激活,并采用温度衰减与...
  • 本公开提供了一种模型更新方法及装置、电子设备、介质、产品,该方法包括:在第一设备通过模型更新任务进行当前迭代轮次的参数更新操作之前,通过数据加载任务将存储于第二设备中的第一状态数据加载至第一设备;其中,数据加载任务的执行过程与模型更新任务执...
  • 本发明公开了一种基于扩散式变异及禁忌搜索算法的进化神经架构搜索优化方法与系统,方法包括:将数据集分成训练集和测试集,初始化算法相关参数和种群;对种群执行交叉操作;变异操作时基于离散噪声扰动规则对架构进行加噪与去噪生成候选个体,并根据动态阈值...
  • 本说明书实施例提供一种模型剪枝方法、装置以及计算设备。方法包括:针对所述模型的输入数据,执行所述模型的前向传播过程中与待剪枝的目标神经网络层对应的前向传播部分,得到与所述目标神经网络层对应的输出矩阵,所述输入数据包括文本和/或图像;基于能量...
  • 本发明涉及深度学习技术领域,公开了多层通道联合度量的深度卷积神经网络滤波器的剪枝方法,该方法包括:对深度卷积神经网络模型进行预训练,得到待剪枝的网络模型;利用上一层、当前层和下一层的滤波器信息进行多层通道联合度量,计算当前层滤波器的重要性度...
  • 本发明公开了一种基于FPGA的卷积神经网络加速器,包括:控制单元、缓存单元、剪枝重构单元、计算单元和输出处理单元。通过在计算单元中配置多个并行的Winograd稀疏乘加处理单元,并结合权重调度器,将具有不同稀疏率的子块分配至不同规模的PE阵...
  • 本发明公开一种基于粒子群算法的跨硬件协同算子优化方法及系统,涉及算子优化技术领域。针对当前跨硬件平台协同方案存在的技术瓶颈,采用方法包括:S1、根据硬件特性配置算子适配规则;S2、基于算子适配规则,将算子‑硬件分配方案编码为粒子位置向量;S...
技术分类