Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于可满足性模理论的大语言模型推理路径剪枝方法,该方法针对现有思维树等多路径推理框架所依赖的启发式评估器不可靠及其引发的计算成本过高问题,通过将大语言模型LLM生成的中间推理步骤自动转换为形式化逻辑约束,并利用可满足性模理论...
  • 本发明涉及人工智能AI大模型领域,尤其涉及一种大模型压缩方法、装置;包括对目标非定制化边缘设备的硬件资源进行感知与建模,构建硬件资源成本预测模型;以硬件资源成本预测模型为约束,对视觉大模型进行压缩优化,得到满足硬件资源预算向量约束的压缩模型...
  • 本申请提供一种目标检测模型训练方法、装置和设备。本申请提供的方法,包括:获取待训练的初始目标检测模型;其中,初始目标检测模型包括主干网络和旁支网络;旁支网络用于在主干网络提供的主路径的基础上增加旁支路径,以在反向传播时仅通过旁支网络进行梯度...
  • 本申请提供一种多任务目标检测模型的训练方法、装置和设备。本申请提供的方法,包括:获取初始多任务目标检测模型;其中,初始多任务目标检测模型包括预训练好的基座网络和对应于多个目标检测任务的多个旁支网络,初始化各个旁支网络的参数;针对每个初始化的...
  • 本发明公开一种面向细粒度文本分类的大语言模型高效微调方法,涉及自然语言处理和机器学习应用技术领域;包括:步骤1:进行数据构造与增强:获取带有细粒度类别标签的文本数据集,所述细粒度类别指多个类别间存在语义相近、容易混淆的关系,采用组合式文本增...
  • 本发明公开了一种基于深度学习的人工智能模型训练方法,属于模型训练技术领域,具体包括:先构建切分子集,统一标注规范并记录样本元信息;再建立子模型集,使用统一骨干网络结合不同增广策略与损失函数形成多视角表征,保持输入输出命名一致;联合训练引入相...
  • 本申请公开了基于线性网络层的视觉生成模型训练方法、装置、设备、介质及产品。包括:将第一训练图像输入至主体隐空间进行特征编码得到第一空间维度的训练图像隐向量,之后通过线性网络层转换为第二空间维度的训练图像隐向量,之后输入至视觉生成子模型得到第...
  • 本申请公开了一种基于图像裁剪的视觉自编码器训练方法及装置,涉及人工智能技术领域。包括:对训练图像进行剪切处理得到局部训练图像,对训练图像和局部训练图像分别进行掩码处理得到掩码全局图像和掩码局部图像;对训练图像进行特征编解码得到重建图像;对掩...
  • 本说明书实施例提供一种生成图形界面智能体的训练数据的方法及装置,可以针对图形界面智能体基于思维链进行训练的方案确定高质量训练数据。其中,图形界面智能体可以通过用户图形界面和用户指令,预测用于完成用户指令所描述任务的操作。对于包括用户图形界面...
  • 本发明公开了一种三维点云分割模型的主动学习训练方法、系统及存储介质。所述方法包括:提供基础分割模型、基础概率模型以及训练数据集;进行有监督预训练得到预训练模型;提取嵌入特征进行拟合训练得到联合概率模型;计算原型特征;进行插值融合得到融合特征...
  • 本发明涉及空间目标检测技术领域,具体提供一种面向暗弱目标检测的递进式主动学习弱监督训练框架,包括:获取样本数据形成样本集,按照目标的信噪比将样本集划分为初始样本集和待评估分组,利用初始样本集训练模型,获得初步训练的模型,开始进行组内迭代:按...
  • 本发明涉及一种基于规则的强化学习与思维链的检索增强生成推理方法,包括步骤:数据预处理;模型训练;采用训练好的模型进行实际推理。本发明的有益效果是:显著提升了大模型的复杂多步推理能力;进行了知识整合,并且优化了检索增强生成(RAG)的效率;降...
  • 本发明属于人工智能与多智能体强化学习技术领域,涉及一种基于梯度保护的多智能体值分解强化学习方法和系统。本发明通过在多智能体环境中采集环境状态向量;将映射到相同哈希值的环境状态向量划为同一分组,得到若干状态分组;选取状态分组中目标值最大的联合...
  • 本发明属于强化学习技术领域,涉及一种基于策略熵的强化学习经验优先回放方法、系统、设备和介质。本发明基于样本经验获取网络损失和可减少策略熵。网络损失能够精确衡量智能体当前策略所产生的动作与最优动作之间的差距。通过引入可减少策略熵,有助于降低噪...
  • 本申请提供一种用于训练对话模型的强化学习方法及装置,所述方法包括:获取经思维链微调后的对话模型针对输入问题生成的回复序列;采用GRPO算法,基于预设奖励函数对所述回复序列进行量化评估,得到所述回复序列对应的奖励值,其中,所述预设奖励函数被配...
  • 本发明属于人工智能领域,公开了一种针对脆弱神经元对抗训练的深度神经网络鲁棒性增强方法,旨在解决现有对抗训练方法中自然精度严重下降的难题。本发明引入正值推动样本的概念,通过精准定位和激活模型的脆弱神经元来指导具有一定攻击性的正值推动样本生成。...
  • 本发明公开了一种序列到点模型的非侵入式用户负荷监测方法及系统,涉及非侵入式电力负荷监测领域,包括构建负荷分解网络结构模型,通过对公开数据集的有监督训练和验证完成对分解网络模型的预训练,通过对私有数据集的有监督训练完成模型的迁移学习,根据监测...
  • 本发明公开了一种基于知识蒸馏与融合的雷达检测模型自进化方法,提出包括适应与强化两阶段的学习框架,构建自适应知识蒸馏算法模块,提取并压缩历史知识形成核心知识集,存储于知识缓冲区,再通过适应阶段快速学习新场景特征分布,提升新场景检测能力,并在强...
  • 本发明涉及一种基于迁移学习的新型配电系统数据挖掘处理方法及系统,包括:采集源配电网以及目标配电网的多维运行数据,并对所述多维运行数据进行特征提取,构成各自对应的特征集合;对源配电网的负荷预测模型进行训练,得到训练后模型,对所述训练后模型进行...
  • 本发明公开了一种面向卷积神经网络的通用性能增强蒸馏方法,涉及人工智能技术领域。该方法先获取师生模型输出的特征图,经通道投影与激活生成重要性图,计算一致性与覆盖率两类互补空间增益;通过可学习像素级门控共识模块建模师生特征关联,自适应输出混合系...
技术分类