河海大学;雅砻江流域水电开发有限公司潘学萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉河海大学;雅砻江流域水电开发有限公司申请的专利基于TD3算法的梯级水电调度方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119026867B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411199335.0,技术领域涉及:G06Q10/0631;该发明授权基于TD3算法的梯级水电调度方法、系统、设备及存储介质是由潘学萍;何胜明;孙晓荣;缪益平;丁仁山;蹇德平;周洁炀;谢洲设计研发完成,并于2024-08-29向国家知识产权局提交的专利申请。
本基于TD3算法的梯级水电调度方法、系统、设备及存储介质在说明书摘要公布了:本发明涉及水电站调度技术领域,尤其涉及一种基于TD3算法的梯级水电调度方法、系统、设备及存储介质,方法包括:构建基于梯级水电站基础数据和运行情况的长期优化调度模型;将长期优化调度模型中的调度问题转化为马尔科夫决策过程;利用双延迟‑确定策略梯度算法TD3对马尔科夫决策过程进行求解,得到梯级水电站中各电站长期调度决策方案;基于实际梯级水电站,输出长期调度决策结果。本发明中,可根据状态量输出该状态下的连续动作空间值,减小网络过估计问题,采用延迟策略更新以及添加噪声平滑目标策略来解决误差积累问题,可有效提升梯级水电站的发电效益。
本发明授权基于TD3算法的梯级水电调度方法、系统、设备及存储介质在权利要求书中公布了:1.一种基于TD3算法的梯级水电调度方法,其特征在于,包括如下步骤:构建基于梯级水电站基础数据和运行情况的长期优化调度模型;将所述长期优化调度模型中的调度问题转化为马尔科夫决策过程;利用双延迟-确定策略梯度算法TD3对所述马尔科夫决策过程进行求解,得到梯级水电站中各电站长期调度决策方案;基于实际梯级水电站,输出长期调度决策结果;所述双延迟-确定策略梯度算法TD3中:使用两个估值网络对动作-值进行评估;更新估值函数的频率大于策略函数;软更新目标策略网络和目标价值网络参数;将用于策略网络参数更新的梯度截取到设定范围内;在探索时使用探索噪声和策略噪声平滑策略期望;所述利用双延迟-确定策略梯度算法TD3对所述马尔科夫决策过程进行求解,包括如下步骤:步骤1:初始化预测价值网络和网络参数分别为w1和w2;步骤2:初始化目标价值网络和网络参数分别为w1′和w2′;步骤3:初始化预测策略网络μθs和目标策略网络μθ′s,网络参数分别为θ和θ′;步骤4:令目标价值网络参数w1′和w2′与预测价值网络参数w1和w2保持一致;步骤5:初始化经验池,并设定其容量D;步骤6:初始化环境模块,生成相应的梯级水电站调度模型,并确定输出初始时刻状态s0;步骤7:确定超参数值,包括总迭代次数M和折扣系数γ;步骤8:从1开始到最终M进行以下步骤的迭代计算;步骤9:初始化环境,并确定输出初始时刻状态s0;步骤10:将状态s0输入预测策略网络a=μθs中,并叠加探索噪声N产生相对应的动作a0=μθs0+N;步骤11:将产生的执行动作a0输入梯级水电站环境中,得到奖励r0和下一时刻状态s1数据,将s0,a0,r0,s1数据以一个单元的形式存入经验池中;步骤12:重复步骤10和步骤11,产生一系列数据组保存于经验池,当时间步长达到环境最大值时,返回步骤9并继续进行操作;步骤13:当循环存储的数据组达到设定数量后,从经验池中随机采样n个经验转移样本s,a,r,s′作为训练数据进行训练计算:步骤13.1:计算扰动后的目标策略网络动作:其为目标策略网络产生的目标动作添加了一个截断噪声;步骤13.2:计算更新的目标:通过将扰动后的目标策略动作以及下一时刻状态代入两个目标价值网络进行最终目标值的计算;步骤14:根据最小化损失函数,利用计算得到的目标值更新两个预测价值网络参数w1和w2:步骤15:根据最大化目标函数,利用更新后的预测价值网络更新预测策略网络参数θ:其中,预测价值网络参数更新两次后对预测策略网络参数进行一次更新;步骤16:软更新目标策略网络和目标价值网络参数:其中τ是一个远小于1的超参数;步骤17:不断利用步骤13到步骤16更新网络参数,并保存最大奖励下的网络参数值,直到达到最终的M次迭代。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河海大学;雅砻江流域水电开发有限公司,其通讯地址为:210024 江苏省南京市鼓楼区西康路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。