Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种基于边侧算力设备的电力大模型剪枝方法及系统,该方法包括:获取边端设备采集到多源运行数据和边端设备的硬件参数数据;对多源运行数据分别进行时域与频域特征提取,得到时域突变特征和空间关联特征,并根据时域突变特征和空间关联特征,确定剪...
  • 本发明公开了一种数据训练的优化方法及系统,涉及优化算法技术领域,包括,利用梯度分布熵值构建频域噪声整形滤波函数,对原始梯度张量进行傅里叶变换后应用频域噪声整形滤波函数,得到滤波频域梯度谱;通过逆傅里叶变换重构滤波频域梯度谱为优化梯度张量;根...
  • 本申请涉及一种基于动态门控的可切换激活网络推理方法、装置及介质。本申请首先将训练数据集中的输入数据输入至第一神经网络,通过可学习的软门控函数,计算第一激活结果。然后,结合与第一激活结果对应的标签,采用直通梯度估计器,通过反向传播最小化预设损...
  • 本申请提供了一种大模型训练优化方法、装置、设备及存储介质,该方法包括获取预训练大模型中目标全连接层的神经元参数,得到待优化参数集;根据所述待优化参数集计算神经元权重向量熵,并根据所述神经元权重向量熵构建总损失函数;基于所述总损失函数更新所述...
  • 本说明书实施例公开了一种信息处理方法、装置及设备,该方法包括:获取用于训练目标大模型的训练数据集,所述训练数据集中包括多个数据组,每个数据组中包括输入数据、输出数据和预期输出数据;基于每个数据组中的输入数据、输出数据和预期输出数据,通过第一...
  • 本发明涉及图神经网络技术领域,具体涉及一种社区结构约束的无监督图节点表示学习方法,首先在单位超球面上初始化节点表示,通过图神经网络编码获取节点嵌入,并构建了融合社区结构的损失函数:社区分散损失通过间隔惩罚增强社区间判别性,节点稳定损失通过历...
  • 本发明是一种用于对话系统中槽填充任务的任务型预训练的对抗性噪声鲁棒性增强的方法,属于自然语言处理领域。本发明采用了一种特定于噪声槽填充任务的噪声对齐预训练框架,其中包含两个任务:槽掩码预测任务和句子噪声判别任务。这些任务的目的是指导预训练语...
  • 本申请公开了基于视觉理解的视觉自编码器训练方法及装置,涉及人工智能技术领域。包括:基于视觉自编码器对训练图像进行特征编解码,得到重建图像;基于视觉自编码器、联合训练文本模型和视觉自编码器对应的教师模型中的至少一个,对训练图像进行视觉理解增强...
  • 本申请公开了基于多尺度残差量子神经网络的自监督训练方法及设备。该基于多尺度残差量子神经网络的自监督训练方法包括:根据预设的多个旋转角度对原始输入图像进行的旋转处理,生成旋转图像集,并将旋转角度作为自监督标签的步骤;构建包括用于特征提取的量子...
  • 本发明提出了一种面向强化学习的多轨迹跨状态奖励归因方法,属于强化学习与图神经网络领域。本发明方法在每轮训练过程中,首先采用传统强化学习方法收集环境交互产生的轨迹数据,并按照原有方式计算策略损失和价值函数损失;同时,基于轨迹数据构建全局状态转...
  • 一种面向关键自动驾驶场景稳定决策的大语言模型增强的强化学习训练方法,构建基于LLM的车辆决策智能体,通过链式思考技术和知识经验池提供高水平指导策略;然后,基于环境风险标志和决策边界参数共同构建动态干预机制,从而决定LLM指导时机;最终,通过...
  • 本申请实施例提供大模型强化学习训练系统和方法,涉及人工智能技术领域。系统的硬件抽象层包括设备管理器、内存池和通信引擎,算法实现层包括算法工厂、模型容器和流水线生成器,用户层包括配置文件、CLI工具。其中,利用硬件抽象层进行统一化适配来支持多...
  • 本发明公开一种动态角色表示的个性化多智能体协同算法,首先通过价值网络对全局状态和历史状态进行编码,为智能体角色分配提供参考,使策略优化具有全局指导性;随后通过引入的角色模块,采用分层二分类的角色划分方法自动对智能体进行动态分组,使智能体在不...
  • 本发明公开了一种基于演化深度强化学习的复杂网络瓦解方法。该方法构建了一个融合了图卷积神经网络与深度Q网络的编码器‑解码器模型,用于高效提取复杂网络中节点的重要性特征,并据此实现节点拆解顺序的动态决策。为优化模型参数并提升搜索能力,引入了演化...
  • 本发明公开了一种基于动态去噪分类器的偏好强化学习鲁棒性提升方法,涉及人工智能与机器学习技术领域。本发明包括:构建动态去噪奖励模型,所述动态去噪奖励模型包括基础奖励预测器和动态去噪分类器;从偏好数据集中采样训练数据,将训练数据输入基础奖励预测...
  • 本申请公开了一种内容审核模型处理方法、装置、电子设备及介质,该方法包括:将目标模态的样本待审核内容和预设审核提示信息输入待训练内容审核模型进行异常内容检测,得到多条内容审核结果,预设审核提示信息用于提示目标模态的异常内容检测项对应的归因定位...
  • 本申请公开了一种强化学习方法、装置、设备、存储介质及产品,涉及人工智能技术领域,包括:根据模型处理轨迹数据对历史轨迹缓存进行更新,生成当前轨迹缓存;基于所述当前轨迹缓存、当前模型梯度以及先验知识数据构建方向性梯度修正;根据所述当前模型梯度以...
  • 本申请涉及智能体学习训练方法、装置、计算机设备和存储介质,该方法包括:采用LLM模型将高层的意图转换为可执行代码,得到克隆数据集,将智能驾驶场景构建为马尔科夫决策过程并构建指令空间;构建智能体策略模型;将训练目标解耦为行为克隆和强化学习的目...
  • 本发明涉及智能体协作技术领域,公开了一种基于多智能体强化学习的人与集群交互的方法和系统。方法包括:基于多智能体强化学习算法构建无人移动平台集群的对抗策略模型;利用基于注意力机制的状态威胁评估模块处理对抗双方的状态,输出对敌方目标的威胁评估系...
  • 本发明属于人工智能技术领域,公开了一种基于对比学习的面向视觉‑语言预训练模型生成可迁移对抗样本方法,包括针对视觉‑语言预训练模型数据增强得到的图像‑文本对集合进行区分,得到正样本集合和负样本集合;在正样本引导对抗样本生成过程中,引入负样本进...
技术分类