Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于多维度奖励的工具集成推理强化学习系统及方法,属于自然语言处理和强化学习领域。本发明包括:工具集成推理提示词设计模块提供预定义的提示词及tag序列训练大语言模型自主生成推理轨迹,选择调用工具或输出最终回复;多维度奖励计算模...
  • 本发明涉及数据传输领域,更具体地,本发明涉及基于深度学习的智能融合终端数据传输自适应方法及装置,方法包括:终端实时采集多源数据,构建用于模型输入的序列;基于所述序列,利用预先训练的预测模型生成未来数据趋势的预测序列;基于预测序列计算风险状态...
  • 本发明具体公开了一种基于分层经验回放的类脑强化学习方法及系统,涉及强化学习与类脑计算技术领域。该方法包括:S1、采集观测数据并进行预处理;S2、初始化经验缓冲池和行动者网络、评论家网络及对应的目标网络,进行参数初始化;S3、初始化探索噪声并...
  • 本发明公开基于云‑边‑端三层强化学习的训练延迟优化方法及系统,属于人工智能与分布式计算技术领域;方法包括:建立云‑边‑端三层强化学习框架,初始化参数;边缘智能体采集子网状态并输出序列划分与局部迭代次数,端设备智能体采集本地状态并输出本地训练...
  • 本发明公开了一种面向创造力诊断与激发的情境化交互式测评方法,所述方法通过执行监督微调和近端策略优化两阶段任务进行创造力测评,包括:预先建立评价指标体系,初始化对话级奖励计算机制,利用预收集交互数据通过监督微调方式更新语言模型参数,生成初始对...
  • 本发明公开了一种以阶段化奖励为导向的决策系统,该系统包括:存储器、处理器以及存储在存储器上的计算机模块,计算机模块用于提供在处理器上运行的计算机程序;计算机模块包括:特征编码模块,用于获取当前牌局信息,并将当前牌局信息当中包括的特征转换为高...
  • 本发明公开了一种智能体的控制策略模型训练方法、装置、设备及存储介质,所述方法包括:构建训练样本集;将训练样本集中每个车辆状态样本输入至待训练策略模型,得到待训练策略模型输出的相应的第二动作推理数据;根据待训练策略模型对应的训练需求确定目标损...
  • 本申请提供了一种通信方法及通信装置,涉及通信领域,能够为通信系统中强化学习的应用提供支撑。该方法包括:确定第一信息,所述第一信息用于训练第一模型,所述第一模型的训练方法为强化学习;向第一设备发送第一信息,所述第一设备为训练所述第一模型的设备...
  • 本发明公开了一种正、负样本构造方法和全模态重排序模型训练方法,属于人工智能技术领域,该方法包括:基于第一多模态大语言模型,构造第一页面的文本模态和图文混排模态的Query,第一页面为第一文档中的一个页面;根据第一页面的模态,将第一页面转化为...
  • 本申请提供了一种模型训练方法、数据预测方法、装置、设备及存储介质;方法包括:确定输入样本,并通过第一编码器对输入样本进行对比学习处理,得到对比损失;通过第一编码器对输入样本进行编码,得到第一编码特征,并基于第二编码器对输入样本进行编码,得到...
  • 本发明公开了一种分布式光伏发电功率预测模型训练方法、数据处理方法、装置、设备、介质及产品。其中,方法包括:通过样本数据训练用于气象和发电功率预测的中央模型,中央模型包括预训练自注意力骨干网络、时空图神经网络和适配器;将经过训练的中央模型的中...
  • 本说明书实施例公开了一种基于快速因果注意力算法的大模型训练方法、装置及设备,所述大模型训练方法包括:获取待训练的训练数据;基于所述待训练的训练数据,生成S矩阵和V矩阵;基于预设的分块数,对所述S矩阵及所述V矩阵进行分块,获得子矩阵网络;按照...
  • 本申请公开了一种模型优化方法、电子设备、存储介质及程序产品,涉及人工智能技术领域,包括:获取输入信息,并将输入信息输入至预设的主模型,得到第一回答信息;将输入信息输入至预设的影子模型,得到第二回答信息;在检测到针对第一回答信息的干预行为的情...
  • 本申请提供一种AI模型的训练方法、芯片及相关设备,该方法包括:模型训练系统在模型的前向传播阶段获取第一矩阵,确定第一矩阵包括的多个m*m的子矩阵中每个子矩阵对应的缩放系数,其中,一个缩放系数用于将对应的子矩阵中的数据由精度高第一数据类型转换...
  • 本发明公开了一种阶段式自适应模型剪枝方法,属于联邦学习技术领域,其包括初始剪枝阶段和进一步剪枝阶段。初始剪枝阶段通过参数重要性评估生成轻量化初始模型,降低初期通信与计算开销;进一步剪枝阶段基于多边端协作与周期性重配置优化模型结构,动态调整以...
  • 本申请公开了一种面向微处理器的神经网络优化方法,属于神经网络优化技术领域,所述方法为:通过为神经网络的每一个网络层结构生成若干条并行的单核精度分支,构建一个初始网络;基于预设的内存约束,通过检测所述单核精度分支在微处理器的内存占用情况,对所...
  • 本实施例公开了一种神经网络训练及图像分类方法、装置、设备、介质和程序产品,其中,神经网络训练方法包括:获取目标任务的训练图像数据,所述训练图像数据包括输入样本和所述输入样本对应的标签;通过基于脉冲神经网络SNN构建的视觉编码器对所述输入样本...
  • 本发明公开一种基于表征工程自适应引导的大模型生成内容可信修复方法,以解决现有大模型可信修复算法选择难、干预强度需自定义,且成本高、泛化性差的问题。该方法包括:构建AB Test形式可信修复样本集;提取正负样本在Transformer解码器层...
  • 本发明公开了一种基于电级联光电反馈激光器的深度时延储备池计算方法,采用的深度时延RC系统包括T型偏置器、半导体激光器和光电探测器;输入层的信号通过T型偏置器注入第一层储备池;激光器1输出的光信号经过光电探测器后分为三路,一路通过反馈时延环路...
  • 本发明公开一种可重构神经形态嗅觉传感忆阻器系统及其制备方法,涉及神经形态电子与智能传感技术领域,包括:传感计算模块,包括基于MXene@SnS22@PANI异质结构的忆阻器,所述忆阻器在气体刺激下表现为突触特性,在电脉冲刺激下表现为神经元特...
技术分类