河海大学华昊辰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉河海大学申请的专利一种基于可切换偏好双图强化学习的需求响应用户侧多主体协同决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121684539B 。
龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610188396.X,技术领域涉及:G06Q10/0631;该发明授权一种基于可切换偏好双图强化学习的需求响应用户侧多主体协同决策方法是由华昊辰;马路遥;梅飞;王博设计研发完成,并于2026-02-10向国家知识产权局提交的专利申请。
本一种基于可切换偏好双图强化学习的需求响应用户侧多主体协同决策方法在说明书摘要公布了:本发明公开了一种基于可切换偏好双图强化学习的需求响应用户侧多主体协同决策方法,通过在奖励与策略层同时引入可切换偏好参数,实现经济性、舒适性与储能设备健康等多目标之间的连续可调;通过构造同质图与异质图的双图结构,并基于尺度匹配关键交互对象选择机制筛选跨类型关键交互对象,采用局部注意力向量与全局注意力向量分别聚合竞争特征与协作特征,形成混合竞争协作特征并输入偏好条件化策略网络;最终采用近端策略优化算法完成集中训练并实现分布式执行,获得可在运行阶段通过偏好参数切换策略行为的分层需求响应协同决策方案。本发明能够解决多目标用户侧主体在执行需求响应任务的过程中对符合自身实时偏好的决策难以有效制定的问题。
本发明授权一种基于可切换偏好双图强化学习的需求响应用户侧多主体协同决策方法在权利要求书中公布了:1.一种基于可切换偏好双图强化学习的需求响应用户侧多主体协同决策方法,其特征在于,包括以下步骤: 建立分层需求响应系统,该系统为由聚合商集合、共享储能运营商集合以及用户集合所构成的用户侧主体集合;基于分层需求响应系统将各用户侧主体行为表述为部分可观测马尔可夫决策过程;为各用户侧主体的部分可观测马尔可夫决策过程建立用户集合的需求响应行为模型; 建立用户集合的舒适度刻画模型,以量化需求响应行为模型的舒适度损失;为共享储能运营商集合构建共享储能模型;基于用户集合的需求响应行为模型构建聚合商集合的分时补偿定价模型;基于用户集合的需求响应行为模型,对分层需求响应系统的需求响应调峰目标缺口进行刻画; 构造可切换偏好参数,利用可切换偏好参数分别定义所建立舒适度刻画模型的目标、共享储能模型的目标、分时补偿定价模型的目标以及需求响应调峰目标的偏好条件化多目标奖励; 基于需求响应行为模型、共享储能模型与分时补偿定价模型所输出的各主体实时物理状态量,计算交互强度权重并进行尺度匹配关键交互对象选择;依据选择出的关键交互对象从用户侧主体集合中筛选出每个主体的异质关键邻居和同质协作邻居,形成异质关键邻居集合和同质协作邻居集合,根据异质关键邻居集合和同质协作邻居集合构造每个用户侧主体的双图结构; 在所有用户侧主体的双图结构内,基于混合图注意力机制对相邻的用户侧主体之间的混合竞争协作关系进行表述,得到混合竞争协作关系特征;基于混合竞争协作关系特征构造主体偏好嵌入向量,将偏好嵌入向量输入偏好条件化策略网络得到动作分布参数,将偏好嵌入向量输入价值网络得到偏好条件化状态值; 利用动作分布参数和偏好条件化状态值,以及偏好条件化多目标奖励,结合近端策略优化强化学习算法,来分别训练偏好条件化策略网络和价值网络,直至收敛,获得用户侧主体集合中每个主体所对应的偏好条件化策略网络的最终策略参数以及价值网络的最终策略参数;利用训练收敛的最终策略参数进行在线运行阶段的偏好切换与协同决策输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河海大学,其通讯地址为:210024 江苏省南京市鼓楼区西康路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励