Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 一种受项目反应理论启发的场景驱动式自动驾驶强化学习方法。首先,通过整合三种不同危险程度现实驾驶场景生成的方法得到多阶段不同难度的驾驶场景并在模型训练过程中不断调整场景的难度,形成多场景学习方法。接着,基于项目反应理论(IRT)和环境参数化模...
  • 本发明公开了一种基于并行强化学习的异构资源协同优化方法,该方法包括:将异构资源分配问题形式化为马尔可夫决策过程,定义状态空间、动作空间、奖励函数以及状态转换机制,并构建基于Q学习的动态决策模型;根据任务目标的类型,将任务目标和异构资源进行分...
  • 本发明公开了一种动态边缘网络中分层联邦学习的图强化学习用户选择与资源分配方法,核心是将图神经网络(GNN)的拓扑感知能力与深度强化学习(DRL)的序列决策能力相结合,以高效地完成每轮联邦学习的用户选择。
  • 本发明公开了一种基于模型的自适应光学动态建模与控制方法及装置,属于自适应光学与基于模型的强化学习交叉领域,包括步骤:将AO系统状态定义为多模态观测的组合,并进行相应编码;通过交叉注意力机制将多模态观测数据进行融合,形成统一且富含动态信息的观...
  • 本发明提出一种基于值分布的融合Reformer模型的多智能体分布式强化学习发电控制方法、装置、计算机设备及介质,该方法首先获取新型电力系统的频率偏差并注入观测模块计算频率偏差多维度特征,采用基于通过基于局部敏感哈希注意力的Reformer模...
  • 本申请提供一种大语言模型训练方法、装置、存储介质及电子设备,涉及计算机技术领域,方法包括:获取目标提示词;将目标提示词输入至训练好的策略模型,得到策略模型输出的目标提示词对应的回复;其中,策略模型是利用改进直接偏好优化方法,基于多个样本提示...
  • 本发明涉及一种基于进化神经架构搜索与强化学习的因果结构发现方法,包括:获取待检测的观测数据,将待检测的观测数据输入因果结构检测模型,获取最高置信度边组成的有向无环图;因果结构检测模型利用训练集训练Actor‑Critic模型获得;Actor...
  • 本发明的一种基于统一强化学习的遥感视觉语言大模型训练方法及装置,属于人工智能与遥感影像处理技术领域,方法包括步骤:对输入的遥感影像和文本指令进行预处理,提取视觉特征和文本特征;进行模态对齐后输入到预训练的大语言模型中进行有监督指令微调,得到...
  • 本申请公开一种基于动态阈值与知识蒸馏的金融风控模型净化方法和系统,方法包括,检测目标风控模型是否受到攻击;响应于确定目标风控模型受到攻击,计算目标风控模型的训练数据的影响函数值,以根据影响函数值在目标风控模型的训练数据集中定位恶意训练数据;...
  • 本申请提供一种模型训练方法及装置、视频生成方法、相关产品,涉及视频生成技术领域。模型训练方法包括:获取样本音频、样本音频对应的预测图片、样本音频对应的真实图片;预测图片由预设的生成器根据闭嘴图片和样本音频生成;闭嘴图片用于展示闭着的嘴唇;根...
  • 本申请公开了一种装备体系对抗网络临机重构方法、设备及介质,涉及网络临机重构领域,该方法包括:获取打击方原始的装备体系对抗网络和临机事件集合;根据临机事件集合,以打击效能最大化、重构时间最小化和任务成本最小化为目标,以装备使用、装备体系对抗链...
  • 本发明属于大模型领域,是一种生成式大模型分步训练方法,包括如下内容:根据技术领域的关键性技术要素以及原始技术文件,构建若干个技术领域的技术知识图谱;并根据构建的技术领域知识图谱和原始技术文件,训练获取技术领域大模型;根据不同技术领域之间的共...
  • 本发明公开了一种基于LLM的学习者智能体模拟学习与遗忘方法及其与教师代理反馈交互框架。其方法主要包括 : S1.学习者的记忆机制,主要通过对话交互从教师代理获取知识以及学习者总结回答问题的经验,并以二元组的形式存储在特定向量数据库中模拟记忆...
  • 本发明涉及人工智能与机器学习技术领域,公开了一种聚类辅助的教师学生模型半监督流式自适应学习方法,旨在解决非平稳数据流场景下利用少量有标签数据和大量无标签数据进行有效分类,并能适应数据流中普遍存在的概念漂移现象;通过集成化概念漂移管理、动态教...
  • 本发明公开了一种自适应低秩分解的域增量模型训练方法及装置,方法包括:冻结预训练模型,构建多领域增量学习模型,多领域增量学习模型包括多个串联的领域增量学习子模型组成的低秩适配器模块及动态路由与参数整合模块;将待训练特征输入各个领域增量学习子模...
  • 本发明涉及一种跨领域图像识别抗灾难性遗忘的提示知识驱动域增量学习方法,本发明设计了实例级别的提示生成器,与领域提示知识库协同工作。提示生成器在生成实例级提示时,同时接收来自当前领域知识库的领域内提示知识和来自当前样本的实例知识,通过双重知识...
  • 本发明属于人工智能技术领域,具体涉及一种子空间集成下高适配微调及伪样本回放的类增量学习方法,具体过程为:根据历史分类器参数以及历史提示模块,计算新类别图像数据集在旧空间的聚类中心,随后对新阶段数据集进行分类,对划分为旧类别的数据赋予“伪标签...
  • 本申请提供的一种模型训练方法、装置、存储介质及计算机设备,首先,通过文本‑图像模态对齐训练,有效缩小了模态间的鸿沟,提升了模型对不同模态数据的理解能力。其次,基于参数重要性评估机制的结构化剪枝,不仅减少了模型的参数量,还保持了模型的精度,解...
  • 本发明涉及一种面向近似计算参数优化的分层多目标优化方法及系统。所述方法包括:构建近似计算承诺书调优的层级化搜索模型。在类别型决策层,将每一种近似策略作为一个臂,采用多臂老虎机算法对臂进行维护,根据得到的Beta分布在每轮迭代中获取随机采样值...
  • 本申请公开了一种基于动态多阶段知识蒸馏模型训练方法、介质和设备,属于模型训练技术领域,该方法包括:构建教师模型与学生模型;提取二者在多个特征提取阶段结束时产生的中间层特征图并进行特征对齐,得到各阶段的教师对齐特征与学生对齐特征;将所有对齐特...
技术分类