合肥工业大学;国网安徽省电力有限公司唐昊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学;国网安徽省电力有限公司申请的专利一种基于深度迁移强化学习的电力系统调度优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115965224B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310163931.2,技术领域涉及:G06Q10/0631;该发明授权一种基于深度迁移强化学习的电力系统调度优化方法是由唐昊;严臻;王正风;李端超;梁肖设计研发完成,并于2023-02-24向国家知识产权局提交的专利申请。
本一种基于深度迁移强化学习的电力系统调度优化方法在说明书摘要公布了:本发明属于电力系统技术领域,更具体地,涉及一种基于深度迁移强化学习的电力系统调度优化方法,其建立了电力系统调度优化模型,并提出了一种基于深度迁移强化学习的电力系统实时优化方法。首先建立了不含弹性资源以及含弹性资源电力系统模型,并使用历史调度数据完成不含弹性资源电力系统决策网络的训练;然后根据含弹性资源电力系统‑状态空间增加的维度对原有神经网络进行输入输出通道扩展;最后对扩展完成后的网络进行参数迁移并进一步训练。本方法通过输入输出通道扩展及参数迁移方法,解决了新调度任务由于状态‑动作维度不同不能进行迁移的问题,有效提升了深度强化学习在新调度任务中的训练效率。
本发明授权一种基于深度迁移强化学习的电力系统调度优化方法在权利要求书中公布了:1.一种基于深度迁移强化学习的电力系统调度优化方法,其特征在于,所述调度优化方法包括以下步骤: 步骤1:确定电力系统所包含的各类资源并为其建立数学模型,所述数学模型为深度调峰机组模型和柔性负荷模型; 步骤2:确定电力系统实时调度任务的优化目标并建立其学习优化模型; 所述步骤2电力系统实时调度任务的优化目标,具体如下: 其中为日总运行代价,为一天的总调度周期数,为调度周期的运行代价,可 表示为: 其中、、、和分别为调度周期的火电机组运行成本、柔性负荷削 减补偿成本、弃风弃光成本、切负荷成本和潮流越限惩罚成本,、、、和为各个成 本的权重系数; 所述步骤2学习优化模型的状态空间和动作空间,具体如下: 含弹性资源的电力系统时刻的系统运行状态向量由时间、各台火电机组出力、光伏电站功率、风 电场功率、负荷实际值和柔性负荷最大可削减量组成,可表示为: 其中为含弹性资源的电力系统的状态空间集合; 第时刻动作向量由各机组出力调整量和柔性负荷削减量组成,可表示为: 其中为含弹性资源的电力系统的动作空间集合; 源任务电力系统状态向量和动作向量可表示为: 其中,为源任务电力系统的状态空间集合; 其中为源任务电力系统的动作空间集合; 步骤3:使用神经网络输入输出维度扩展方法,将源任务神经网络参数迁移至目标任务; 所述步骤3中神经网络输入输出维度扩展方法,具体如下: 步骤3.1:将状态向量分为和两部分,其中为中与最相似的向量,将分为和两部分,其中向量为中与最相似的向量; 步骤3.2:为新增的状态向量或动作向量增加网络输入通道,表示源任务神经 网络权重,表示新增输入通道神经网络权重,表示源任务神经网络偏置,则网络输出 可表示为: 其中和表示网络输入,对于Actor网络和目标Actor网络,,,而对于 Critic网络和目标Critic网络,,; 步骤3.3:为增加网络输出通道,和表示源任务神经网络权重和偏置,和 表示新增输出通道神经网络权重和偏置,则网络输出可表示为: 其中表示上一层神经网络的输出,对于Critic网络和目标Critic网络,,; 步骤3.4:目标任务Actor网络输入为状态,输出为动作,按步骤3.2和步骤3.3对其 进行通道扩展; 步骤3.5:目标任务Critic网络输入为输出为,输出为在状态时执行动作 的Q值,采用步骤3.2扩展输入维度,采用步骤3.4相同方法进行网络参数初始化; 步骤4:网络参数迁移后采用DDPG算法进一步优化求解,获得实时调度计划。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学;国网安徽省电力有限公司,其通讯地址为:230009 安徽省合肥市屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。