Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 用于训练机器学习系统的计算机实现方法,包括:通过机器学习系统的编码器并且基于训练传感器信号,确定第一中间表示和第二中间表示,第一中间表示表征潜在空间的潜在分布的均值,第二中间表示表征所述潜在分布的方差和/或协方差;基于第一中间表示和第二中间...
  • 本申请涉及数据采样技术领域,特别涉及一种神经网络训练数据集生成方法、装置、设备及存储介质,包括:获取零部件虚拟模型的形状数据、材料数据和目标载荷位置空间;根据形状数据和材料数据确定零部件虚拟模型的边界约束条件;在目标载荷位置空间进行载荷点分...
  • 本公开关于一种编码器的前后处理神经网络的训练方法、编码器的编码方法及装置、电子设备和存储介质。编码器的前后处理神经网络的训练方法包括:将第一训练视频输入到编码器,通过编码器对第一训练视频进行预处理,得到第一预处理训练视频和第一预处理信息;将...
  • 本申请涉及一种算子精度的检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,所述方法包括:获取深度学习模型中各网络层的属性信息;根据各所述网络层的属性信息,确定各所述网络层的检测模式;根据所述检测模式对相应的所述网络层的算子精度...
  • 提供了一种用于修改用于处理多媒体数据的深度学习模型的架构的方法和神经处理器。本公开涉及用于修改深度学习模型的架构的自动化方法,以基于在片上系统(SoC)中执行的深度学习模型来提高推断性能。所述用于修改深度学习模型的架构的示例方法包括:在包括...
  • 本发明涉及深度学习技术领域,尤其涉及一种基于强化学习的动态聚类通道剪枝方法,利用训练图像对经典分类网络进行预训练,得到预训练网络模型;统计预训练网络模型的特征多频响应,构建通道级的网络状态表示;以网络状态表示为顶点构建超图,并利用超图卷积进...
  • 本发明涉及大模型算法技术领域,尤其涉及一种基于稀疏化剪枝的大模型动态压缩优化方法及系统,该方法捕获推理中因资源波动产生的原始权重波动数据,经稀疏化处理得到稀疏权重基准数据;通过模型推理延迟数据解析计算复杂度,分离出模型规模导致的推理延迟量;...
  • 一种基于可学习权重的Token级多模态模型量化方法,包括步骤:将满足模态一致性要求的校准样本输入Token级敏感度模型,生成用于表示Token相对重要性的Token级敏感度评分;根据校准样本输入多模态模型获取的未量化浮点输出和伪量化输出,生...
  • 本发明公开了一种改进的多目标遗传算法及其在涡轮叶片狭缝设计中的应用,该方法首先基于叶片狭缝的几何参数和温度泄漏流量数据建立快速预测代理模型,然后定义叶顶局部最高温度和泄漏流量作为优化目标,最后采用改进的 NSGA‑Ⅱ算法进行多目标优化,获取...
  • 本申请实施例提供了一种图文匹配模型的训练方法和装置、设备及介质,属于人工智能技术领域。该方法包括:通过图文匹配模型对每一图像样本和每一文本样本进行编码;从编码后所得的多个文本样本特征中将与图像样本特征的相似度最高的文本样本特征确定为最近邻文...
  • 本发明涉及自然语言处理领域,公开了一种金融语言模型训练方法、装置、计算机设备及存储介质,获取包含幻觉标注数据的第一金融样本数据;将第一金融样本数据输入多任务监督模型进行训练,获得已训练多任务监督模型;将第二金融样本数据输入已训练多任务监督模...
  • 本说明书实施例提供模型训练方法以及平台、文本推理方法以及平台,其中所述模型训练方法包括:获取初始样本集、学生推理模型和学生推理模型的推理能力标签,其中,初始样本集包括多个样本思维链,多个样本思维链为教师推理模型采用不同的推理方法生成,任一样...
  • 本发明提供一种智能体的中介策略的训练方法,包括以处理器执行:从多个策略中选择一源策略及一目标策略,其中每个策略用于驱动智能体执行多个动作以处于多个状态,每个状态包括多个物理属性。从源策略中及目标策略中的所述多个状态中各自选择一个作为源状态及...
  • 本公开提供一种强化学习系统的奖励生成方法及相关装置,涉及计算机技术领域。该方法为:对异构环境数据进行划分处理,获得多个维度数据和每个所述维度数据对应的异构信息;根据每个所述维度数据的异构信息,分别确定对每个所述维度数据进行奖励分析的目标神经...
  • 本申请公开了基于双向加权策略蒸馏的深度强化学习模型压缩方法,包括获取至少一教师模型,所述教师模型被训练为表现优异,能够用于指导学生模型的训练;所述学生模型为对应教师模型的压缩模型;对所述教师模型进行评估,获取所述教师模型的策略知识,并将所述...
  • 本发明公开了一种基于动态掩码注意力的多起点序列决策强化学习方法,包括以下步骤:获取杀伤网中的装备节点以及对抗环决策任务目标;将对抗环决策建模为具有决策空间的马尔可夫决策过程;采用动态掩码注意力模型学习马尔可夫决策过程中的最优策略,在注意力模...
  • 本发明提供一种动态自适应强化学习模型的训练方法及系统,包括:步骤一:智能体知道在任何状态下执行任何动作所获得的回报,即R(Tn, sk)已知,在每个离散的时间步k=1,2,……n上,观察当前的状态Tn;步骤二:选择需要执行的动作sk,从而收...
  • 本发明涉及人工智能与强化学习领域,具体提出一种基于动力学一致性约束的扩散离线强化学习规划方法。现有扩散模型虽能规划长时域轨迹,但轨迹中常存在动作可行性不足,部分采样动作在真实环境中难以执行并实现预期效果,导致计划轨迹与执行轨迹存在偏差。为解...
  • 本发明涉及强化学习技术领域,解决了智能体进入数据集中未涵盖的OOD state时会陷入连续OOD轨迹,导致性能严重下降的技术问题,尤其涉及一种离线强化学习中主动避免OOD state的方法,旨在仅从一个固定的、预先存在的离线数据集学习一种有...
  • 本发明公开了一种基于多保真评估的高效搜索综合鲁棒网络架构方法,包括:训练包含多个子网络架构的超网;从超网中采样子网络架构,采用多种鲁棒性评估手段计算模型的鲁棒精度,通过相关性分析合并相似类型的评估手段,获得缩减后的评估方式;从超网中采样子网...
技术分类