Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种分布式光伏发电功率预测模型训练方法、数据处理方法、装置、设备、介质及产品。其中,方法包括:通过样本数据训练用于气象和发电功率预测的中央模型,中央模型包括预训练自注意力骨干网络、时空图神经网络和适配器;将经过训练的中央模型的中...
  • 本申请提供了一种模型训练方法、数据预测方法、装置、设备及存储介质;方法包括:确定输入样本,并通过第一编码器对输入样本进行对比学习处理,得到对比损失;通过第一编码器对输入样本进行编码,得到第一编码特征,并基于第二编码器对输入样本进行编码,得到...
  • 本发明公开了一种正、负样本构造方法和全模态重排序模型训练方法,属于人工智能技术领域,该方法包括:基于第一多模态大语言模型,构造第一页面的文本模态和图文混排模态的Query,第一页面为第一文档中的一个页面;根据第一页面的模态,将第一页面转化为...
  • 本申请提供了一种通信方法及通信装置,涉及通信领域,能够为通信系统中强化学习的应用提供支撑。该方法包括:确定第一信息,所述第一信息用于训练第一模型,所述第一模型的训练方法为强化学习;向第一设备发送第一信息,所述第一设备为训练所述第一模型的设备...
  • 本发明公开了一种智能体的控制策略模型训练方法、装置、设备及存储介质,所述方法包括:构建训练样本集;将训练样本集中每个车辆状态样本输入至待训练策略模型,得到待训练策略模型输出的相应的第二动作推理数据;根据待训练策略模型对应的训练需求确定目标损...
  • 本发明公开了一种以阶段化奖励为导向的决策系统,该系统包括:存储器、处理器以及存储在存储器上的计算机模块,计算机模块用于提供在处理器上运行的计算机程序;计算机模块包括:特征编码模块,用于获取当前牌局信息,并将当前牌局信息当中包括的特征转换为高...
  • 本发明公开了一种面向创造力诊断与激发的情境化交互式测评方法,所述方法通过执行监督微调和近端策略优化两阶段任务进行创造力测评,包括:预先建立评价指标体系,初始化对话级奖励计算机制,利用预收集交互数据通过监督微调方式更新语言模型参数,生成初始对...
  • 本发明公开基于云‑边‑端三层强化学习的训练延迟优化方法及系统,属于人工智能与分布式计算技术领域;方法包括:建立云‑边‑端三层强化学习框架,初始化参数;边缘智能体采集子网状态并输出序列划分与局部迭代次数,端设备智能体采集本地状态并输出本地训练...
  • 本发明具体公开了一种基于分层经验回放的类脑强化学习方法及系统,涉及强化学习与类脑计算技术领域。该方法包括:S1、采集观测数据并进行预处理;S2、初始化经验缓冲池和行动者网络、评论家网络及对应的目标网络,进行参数初始化;S3、初始化探索噪声并...
  • 本发明涉及数据传输领域,更具体地,本发明涉及基于深度学习的智能融合终端数据传输自适应方法及装置,方法包括:终端实时采集多源数据,构建用于模型输入的序列;基于所述序列,利用预先训练的预测模型生成未来数据趋势的预测序列;基于预测序列计算风险状态...
  • 本发明公开了一种基于多维度奖励的工具集成推理强化学习系统及方法,属于自然语言处理和强化学习领域。本发明包括:工具集成推理提示词设计模块提供预定义的提示词及tag序列训练大语言模型自主生成推理轨迹,选择调用工具或输出最终回复;多维度奖励计算模...
  • 本发明属于智能交通领域,涉及一种未来特征增强的车辆轨迹预测生成对抗方法,包括:条件信息学习步骤,完成历史与未来特征的联合建模;生成对抗训练步骤,采用CVAE‑GAN混合架构进行多模态轨迹预测;其中CVAE‑GAN混合架构包括编码器、生成器和...
  • 本公开涉及一种图文大模型的微调方法、装置、设备、介质以及产品,其方法包括:获取多个数据样本;各数据样本中包含图像数据和文本数据;通过多个数据样本对图文大模型进行蒸馏训练,得到第一输出特征;其中,第一输出特征包括图文大模型中各个网络层对图像数...
  • 本发明公开了一种基于动态logits调整的弱模型到强模型的知识迁移方法,包括以下步骤:1)获取具有同构架构、共享词汇表的大模型LLM和小模型SLM;2)根据任务场景对小模型进行微调后进行知识转移。本发明提出一种基于动态logits调整的弱模...
  • 本申请提供测试场景的风格迁移方法、装置、电子设备及存储介质,获取原始测试场景数据和目标风格的参考数据;原始测试场景数据包括自动驾驶测试场景中的各个场景元素;目标风格的参考数据包括目标风格的自然语言描述和目标风格的参考图像中的至少一种;从原始...
  • 本申请公开了一种用于跨边缘的联邦域增量学习方法、装置、介质和设备,通过采用基于K中心启发式的核心集回放算法,从第一旧域数据中筛选出核心样本集;采用弹性权重巩固与渐进式知识蒸馏的混合策略平衡新任务知识的学习与核心样本集的保留比重,得到特征平衡...
  • 一种基于属性约简的符号知识与数值知识协同蒸馏方法,包括:划分数据集;构建并训练教师模型;对训练集构建概念格并进行属性约简;提取符号规则;构建学生模型并生成初始的分类数据;构建数值与符号规则协同蒸馏损失函数并训练学生模型;测试学生模型分类效果...
  • 本发明涉及一种多粒度任务自适应共享的多任务协同适配方法,属于多任务学习领域,本发明通过建立信息组合树建立多粒度的任务共享特征信息,并设计任务注意力模块从树上提取对特定任务有益的特征信息,解决了现有多任务学习面临的任务间差异较大引起的优化困难...
  • 本发明提供基于迁移学习的新品水果原汁加工工艺智能迁移方法,通过工艺日志结构化建库、基于Transformer架构的工艺知识编码器、跨域特征空间映射网络、多任务损失联合优化和工艺窗口动态约束控制,实现对不同水果品类间的共性操作经验提取、工艺参...
  • 本申请的实施例公开了一种纵向联邦学习推演方法、装置、设备及介质,方法包括:AF网元作为VFL服务器发起纵向联邦学习推演服务,多个NWDAF作为客户端加入到纵向联邦学习推演服务中,并执行纵向联邦学习推演服务,在执行推演过程中,AF输出聚合得到...
技术分类