东南大学虞文武获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种目标函数未知的动态资源分配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116260775B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310250033.0,技术领域涉及:H04L47/783;该发明授权一种目标函数未知的动态资源分配方法是由虞文武;陈都鑫;王和;刘洪喆;孟浩飞;戴鹏程设计研发完成,并于2023-03-15向国家知识产权局提交的专利申请。
本一种目标函数未知的动态资源分配方法在说明书摘要公布了:本发明提供了一种目标函数未知的动态资源分配方法,该方法设计了一种新的分布式强化学习算法。本发明提出的分布式强化学习算法基于多智能体系统和强化学习模型,采用分布式的方式解决了动态资源分配的问题,可以在目标函数未知的情况下,实现智能体之间的网络资源分配。此外,本文提出的分布式强化学习算法不仅可以提供算法的隐私保护和信息安全,还可以提高算法的可扩展性。通过仿真结果实例,说明该分布式强化学习算法在目标函数未知的动态资源配置问题的数值示例中具有良好的性能和有效性。
本发明授权一种目标函数未知的动态资源分配方法在权利要求书中公布了:1.一种目标函数未知的动态资源分配方法,其特征在于,所述方法包括以下步骤: 步骤1:构建目标函数未知的动态资源分配问题模型; 步骤2:设计目标函数未知的动态资源分配方法,得到分布式迭代公式,并迭代求解; 所述步骤1中动态资源分配问题模型具体为,简称模型1, 1 其中表示智能体的成本函数,表示智能体在时间的局部资源分配, 表示时刻的总网络资源,为资源转移函数,为智能体的局部资源配置离散约束, 另外,智能体通过网络通信图进行信息交互; 所述步骤2中目标函数未知的动态资源分配方法设计如下, 动态资源分配问题模型中的目标函数的函数表达式未知,在目标函数未知的动态资源 分配方法,假设第次试验时刻的的值,可行资源分配为,总 目标函数值为,每个智能体能够使用局部目标函数值产生的数 值,智能体与它的邻居智能体交互局部资源信息; 更新智能体的函数:对于任意时刻,智能体的局部q函数由以及本地 动作定义,对于时刻,以及所有潜在的,设置函数的初始值,其中是一个常数,假设智能体在第次试验'时刻内采 用可行资源分配,其中,智能体函数的更新规则 如下所述: 5 其中 ,在时刻,对于所有潜在的,令 更新智能体的本地策略:对于t时刻内所有潜在的,定义为可行资源分配,智能体在第次试验'时刻内 的局部策略更新规则如下: 6 平衡探索与利用:智能体使用策略平衡探索与利用,在第次试验时 刻,以的概率使用或以的概率使用其他可行资源分配。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励