Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提出一种基于双Actor结构的可拓展分布式强化学习方法与系统,涉及人工智能与强化学习技术领域,其中,方法包括:初始化各智能体包含的双Actor网络,所述双Actor网络包含两个策略网络,分别为训练Actor与基线Actor,二者结构与...
  • 本发明公开了一种用于具身导航决策理解的智能体训练方法,旨在解决现有技术中具身导航智能体因依赖单一路径模仿而导致的泛化能力和决策能力不足的问题。本发明的核心在于两大创新:a)一种新颖的训练数据集生成流程,该流程在智能体的每个决策点,为场景中所...
  • 本发明属于多智能体强化学习领域,公开了一种基于混合博弈的关系驱动多智能体强化学习方法及系统,策略网络生成智能体动作并交互环境以采集样本数据;集中式价值评估器基于样本计算智能体的边际影响值,推导出社交影响权重集合;基于权重将群体外部奖励分配为...
  • 本申请提供的船舶航线规划模型训练方法及相关装置中,电子设备获取船舶智能体当前的观测状态;其中,观测状态包括船舶智能体观测到的障碍物;根据观测状态,确定船舶智能体与障碍物之间的碰撞风险;通过船舶智能体对观测状态以及碰撞风险进行处理,得到针对观...
  • 本发明涉及强化学习技术领域,提供了一种用于分布式并行强化学习的Web架构模型训练方法和装置。本发明每个训练节点分别训练相应的局部模型,并在完成预定轮数的训练后,将更新后的局部模型参数通过Web服务上传至融合服务节点;融合服务节点获取各个所述...
  • 本申请公开了一种模型动态调度方法、设备、存储介质及程序产品,涉及人工智能的技术领域。在本申请中,通过构建包括融合信息以及在模型动态调度系统已集成模型中选取的目标模型的训练数据,对强化学习模型进行训练,进一步根据训练得到的强化学习模型利用实际...
  • 本发明提供了一种基于多目标结构化奖励函数的强化学习训练方法及系统,包括:环境模拟层包含物理引擎和血管环境模拟器,用于模拟导管在血管内的物理运动和交互,并提供环境状态给奖励计算层;奖励计算层通过多个独立的计算模块进行计算后最终通过复合奖励聚合...
  • 本发明公开了一种基于自我认知探索的网页智能体自适应学习方法及系统。本发明方法首先获取目标网页截图,由外部模型识别并标注可交互元素,初始化探索有向图并配置网页智能体;然后智能体实例化出选择器、预测器和判别器,通过多轮外层自更新与多步内层交互,...
  • 本公开涉及一种面向极少量样本的风电功率预测模型的训练方法及装置。包括:获取风电场的训练样本对,训练样本对包含的历史数值天气预报数据为不均衡的训练样本;利用训练样本对,迭代训练初始编码器,得到训练好的编码器,实现了利用无标签数据训练编码器,降...
  • 本公开属于人工智能技术领域,提供了一种基于TD3算法的智能体及训练方法,所述智能体为基于TD3算法构建,并结合自适应归一化和优先经验回放算法训练,用于生成连续策略的DRL模型;所述TD3算法包括双Critic网络、延迟更新和目标策略平滑;所...
  • 本发明公开了一种基于剪枝的多模型压缩部署方法、系统、介质及设备,属于人工智能模型压缩与边缘计算技术领域,所述方法为:分别提取各待部署模型的网络层拓扑关系,构建内部依赖图;迭代计算节点重要性分值,每轮剪除重要性最低且不在关键路径上的节点及边,...
  • 本发明公开一种面向微电网群协同优化的分布式算法模型压缩方法、电子设备及存储介质。压缩方法根据微电网群物理拓扑结构,将全局优化模型拆分为多个子模型;采用融合权重幅值与梯度信息的参数重要性评估策略对子模型进行结构化自适应裁剪,引入电力系统暂态稳...
  • 本申请公开了一种网络模型的训练方法、提问文本的处理方法、装置及设备,属于计算机技术领域。该网络模型的训练方法包括:获取样本提问文本和样本提问文本对应的标准重写提问文本;调用第一网络模型基于样本输入信息执行提问文本重写任务,得到第一输出结果,...
  • 本申请实施例提供了一种模型优化方法、装置、电子设备及存储介质,涉及深度学习技术领域。方法包括:获取待优化计算图;若待部署模型为未量化的模型,待优化计算图中表征RoPE结构的第一子图中的两个Reshape算子和位于该两个Reshape算子之间...
  • 本申请涉及电路设计技术领域,特别涉及一种级联交叉阵列、数据处理方法及电子设备,其中,阵列包括:至少一个第一行线、至少一个第二行线和至少一个列线,其中,第一行线和第二行线与列线的交叉节点处设置有忆阻器件;电压输入模块,电压输入模块包括至少一个...
  • 本申请公开了一种模型推理的硬件加速方法和电子设备,该方法可以包括:在处理器的片上存储器中分配至少两个缓冲区,用于通过直接内存访问(DMA)交替地从外部存储器搬运模型权重矩阵分块,模型权重矩阵分块用于计算生成目标词元向量中的部分词元向量;控制...
  • 本发明提供了一种多感官跨模态单片集成式神经拟态器件,可应用于新型半导体器件技术领域。该器件包括:衬底,衬底的第一表面被设备为包括一凹槽;第一半导体材料层,位于衬底的第一表面上,且第一半导体材料层与衬底在凹槽形成悬空结构;第二半导体材料层,位...
  • 本申请涉及一种神经网络训练处理器的建模方法和装置,该方法通过调用任务层将待模拟的神经网络模型进行解析为计算图,并将计算图中多个算子任务映射至待建模处理器的处理核,通过调用计划层根据计算图生成任务执行计划,通过调用运行层根据任务执行计划模拟各...
  • 本申请涉及一种面向神经网络计算的可重构计算架构,包括多精度乘累加阵列、输入缓存区、权重缓存区和控制单元;多精度乘累加阵列包含多个锁存器和多个计算单元;控制单元用于从权重缓存区中存储的权重数据中确定当前计算所需的目标权重数据,并将目标权重数据...
  • 本申请属于人工智能的技术领域,公开了一种端侧模型量化误差控制方法、装置、电子设备及存储介质,该方法包括:获取端侧AI模型中计算运算符的激活值统计信息,根据激活值统计信息,检测计算运算符的激活值分布是否发生偏移,以判断计算运算符的量化参数是否...
技术分类