Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东北大学秦皇岛分校袁晓铭获国家专利权

东北大学秦皇岛分校袁晓铭获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东北大学秦皇岛分校申请的专利一种基于多智能体深度强化学习的计算卸载优化策略获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119322681B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411561974.7,技术领域涉及:G06F9/50;该发明授权一种基于多智能体深度强化学习的计算卸载优化策略是由袁晓铭;田汉森;张馨灵;陈礼鑫;黄锟达;王松雨设计研发完成,并于2024-11-05向国家知识产权局提交的专利申请。

一种基于多智能体深度强化学习的计算卸载优化策略在说明书摘要公布了:本发明提供一种基于多智能体深度强化学习的计算卸载优化策略,涉及智能算法技术领域。该基于多智能体深度强化学习的计算卸载优化策略,针对MEC多用户计算卸载场景设计的多智能体深度强化学习算法。本发明,利用值分解技术,构建了针对每个任务的任务Q网络结构,并在考虑智能体所有任务关系的基础上生成相应的任务Q值。这些任务Q值可以进一步聚合以得到智能体的Q值,有效缓解了多任务智能体在复杂参数化动作空间中所面临的高时间和空间复杂度问题。此外,在混合网络中利用自注意力机制,针对不同用户的特征动态地分配相应的权重。从而实现更精准的智能体间交互表示,提升了整体决策的灵活性和有效性。

本发明授权一种基于多智能体深度强化学习的计算卸载优化策略在权利要求书中公布了:1.一种基于多智能体深度强化学习的计算卸载优化策略,其特征在于:针对MEC多用户计算卸载场景设计的多智能体深度强化学习算法,算法的具体步骤如下: 步骤一:初始化所有智能体以及混合网络的在线网络参数θ和目标网络参数θ′,初始化所有智能体经验池和系统经验池其中表示智能体的集合; 步骤二:各智能体通过感知环境获取局部状态信息ot,i以及部分全局信息每个智能体根据当前的局部感知信息ot,i,通过目标策略网络生成对应的资源分配策略 步骤三:将步骤二获得的连续动作与状态信息ot,i进行组合,并将其分解为对应智能体各个任务的任务状态和任务连续动作其中表示智能体i的任务集合,任务状态信息中不仅包含智能体的感知信息ot,i,还包含除对应任务j以外其他任务的连续动作 步骤四:任务信息被传递至智能体中对应每个任务的MPTQ网络,以生成Q值矩阵在此过程中,这些任务信息将针对相应的卸载决策以多批次的方式输入到MPTQ网络中,从而有效消除与无关连续动作信息的干扰,Q值矩阵中的每一行代表所有任务的任务Q值不同行则反映了由于对应任务的卸载决策st,i,j不同而对所有任务Q值的影响; 步骤五:每个MPTQ网络选择任务Q值聚合后最大的智能体Q值Qist*,i,j对应的行所表示的卸载决策为对应任务的最优卸载决策并且,所有MPTQ的最优卸载决策所对应的任务Q值聚合后形成最优智能体Q值 步骤六:每个智能体将步骤二中获得的资源分配策略与步骤五中的最优卸载决策结合,作为智能体的动作at,i与环境进行交互,从而获取相应的智能体收益rt,i和下一状态ot+1,i,以及部分全局信息每个智能体将其经验信息ot,i,at,i,rt,i,ot+1,i存储到各自的经验池中和系统经验池中; 步骤七:每个智能体将步骤六获得的最优智能体Q值与智能体局部信息结合,并输入到自注意力机制网络中,以生成每个智能体的加权Q值加权的智能体Q值与部分全局信息输入到混合网络,最终得到全局Q值 步骤八:每个智能体从各自的经验池中采样经验数据,以训练MPMT-DQN中的Actor和MPMTQ在线网络,并通过软更新的方式更新各自的目标网络; 步骤九:从系统经验池中采样经验数据,以训练混合网络、自注意力机制网络及各个智能体的MPMTQ网络,以确保智能体网络在最大化个体收益的同时,实现系统整体收益的最大化; 步骤十:重复步骤二到步骤九,直至算法收敛。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学秦皇岛分校,其通讯地址为:066004 河北省秦皇岛市海港区泰山路143号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。