北京中数睿智科技有限公司韩涵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京中数睿智科技有限公司申请的专利基于强化学习的智能体动态决策网络生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120197644B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510679404.6,技术领域涉及:G06F18/213;该发明授权基于强化学习的智能体动态决策网络生成方法是由韩涵;王甫宁;何江;和龙博;孙昊;夏暄;陈善君设计研发完成,并于2025-05-26向国家知识产权局提交的专利申请。
本基于强化学习的智能体动态决策网络生成方法在说明书摘要公布了:本发明涉及人工智能技术领域,尤其涉及一种基于强化学习的智能体动态决策网络生成方法。所述方法包括以下步骤:接收用户输入的信息需求数据;对信息需求数据进行特征解析,并提取业务目标、约束条件和关键参数,以得到信息需求解析结果;识别信息需求解析结果所对应的任务流程,根据任务流程匹配API调用链,以得到任务需求技术蓝图;根据任务需求技术蓝图并利用预设的动态工作流引擎生成智能体工作流;对语言需求解析结果进行上下文语境分析,得到上下文语境信息;基于上下文语境信息将智能体工作流划分超长思维链。综上所述,本发明通过强化学习技术,能够根据用户需求自动生成并持续优化智能体,支持复杂业务场景的高效决策和动态适应。
本发明授权基于强化学习的智能体动态决策网络生成方法在权利要求书中公布了:1.一种基于强化学习的智能体动态决策网络生成方法,其特征在于,包括以下步骤: 步骤S1:接收用户输入的信息需求数据;对信息需求数据进行特征解析,并提取业务目标、约束条件和关键参数,以得到信息需求解析结果;识别信息需求解析结果所对应的任务流程,根据任务流程匹配API调用链,以得到任务需求技术蓝图; 步骤S2:根据任务需求技术蓝图并利用预设的动态工作流引擎生成智能体工作流;对语言需求解析结果进行上下文语境分析,得到上下文语境信息;基于上下文语境信息将智能体工作流划分超长思维链,根据超长思维链确定智能体工作流的节点和路径; 所述基于上下文语境信息将智能体工作流划分超长思维链,根据超长思维链确定智能体工作流的节点和路径包括: 从智能体工作流中提取每个任务节点的上下文语境信息,包括任务节点的输入参数、输出参数和执行环境; 对每个任务节点的上下文语境信息进行编码,并将输入参数、输出参数和执行环境转换为向量形式; 计算向量之间的余弦相似度确定相邻任务节点之间的相似度; 根据相邻任务节点之间的相似度将任务节点分组,将相似度高于预设相似度阈值的任务节点归为同一思维单元; 对每个思维单元,根据任务节点的依赖关系和优先级,确定任务节点的执行顺序; 将所有思维单元按照任务节点的执行顺序进行串联,形成超长思维链; 对超长思维链进行优化,通过调整任务节点的顺序和路径,确保思维链的连贯性和效率; 根据超长思维链中的任务节点和路径连接方式,确定智能体工作流的节点和路径; 步骤S3:采集智能体业务需求数据;根据智能体业务需求数据动态调整智能体工作流中的节点和路径; 步骤S4:构建智能体分层强化学习框架,包括战略层、战术层和执行层;在战略层,采用强化学习算法,预测智能体业务需求数据的长期业务目标达成路径并确定季度级优化策略;在战术层,使用近端策略优化算法,在周维度调整智能体工作流节点配置与资源分配方案;在执行层,应用深度Q网络算法,实时优化智能体工作流的单任务执行策略; 所述在战略层,采用强化学习算法,预测智能体业务需求数据的长期业务目标达成路径并确定季度级优化策略包括: 在战略层,对智能体业务需求数据进行任务完成率测定,并记录为战略业务指标; 将战略业务指标输入到强化学习算法中,并初始化环境状态和智能体的初始策略; 通过模拟环境与智能体的交互,收集智能体在不同策略下的业务执行结果,记录每个策略的奖励值; 根据业务执行结果和每个策略的奖励值,使用强化学习算法中的策略迭代方法,更新智能体的策略; 基于更新后的策略预测智能体业务需求数据的长期业务目标达成路径,生成季度级优化策略; 所述在战术层,使用近端策略优化算法,在周维度调整智能体工作流节点配置与资源分配方案包括: 在战术层,从智能体工作流中提取当前节点配置和资源分配情况;其中,当前节点配置包括节点的类型、数量以及连接关系,资源分配情况包括每个节点的资源类型、数量以及分配比例; 将当前节点配置和资源分配情况输入到近端策略优化算法中,初始化策略参数,设置算法的运行环境,包括模拟环境的初始状态和智能体的初始策略; 在周维度上,对每个节点的资源分配进行评估,记录每个节点的资源使用效率和任务完成情况,以生成资源分配评估结果;其中,资源使用效率包括资源的类型、数量和使用时间,任务完成情况包括任务的类型、数量和完成时间; 根据资源分配评估结果使用近端策略优化算法调整每个节点的资源分配,优化资源使用效率,更新策略参数; 步骤S5:在智能体执行任务过程中,基于智能体分层强化学习框架构建并生成智能体动态决策网。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中数睿智科技有限公司,其通讯地址为:100083 北京市海淀区知春路23号10层1014室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励