Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东北电力大学;华北电力大学杨浩获国家专利权

东北电力大学;华北电力大学杨浩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东北电力大学;华北电力大学申请的专利考虑暂态电压恢复需求的受端电网响应驱动减载控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119726757B

龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411767844.9,技术领域涉及:H02J3/12;该发明授权考虑暂态电压恢复需求的受端电网响应驱动减载控制方法是由杨浩;崔新颜;金博;王佳怡;丁肇豪;李世龙;丰硕;时雪峰设计研发完成,并于2024-12-04向国家知识产权局提交的专利申请。

考虑暂态电压恢复需求的受端电网响应驱动减载控制方法在说明书摘要公布了:本发明提供了一种考虑暂态电压恢复需求的受端电网减载控制方法,属于响应驱动式减载控制,解决了新能源大规模接入受端电网和传统化石能源同步机组大量置换而导致的系统调压能力不足的技术问题。其技术方案为:包含以下步骤:1建立暂态电压控制的马尔可夫序贯决策过程模型;2设计马尔可夫过程中的状态、动作、奖励;3建立基于DoubleDQN的强化学习模型;4进行离线集中学习训练相应智能体;5形成分散式自适应减载控制方法。本发明的有益成果为:能够综合部署于各个负荷站点的减载控制器,实现“监测‑判定‑决策‑控制”的闭环分散式减载控制策略,以促进电网整体电压恢复。

本发明授权考虑暂态电压恢复需求的受端电网响应驱动减载控制方法在权利要求书中公布了:1.一种考虑暂态电压恢复需求的受端电网响应驱动减载控制方法,其特征在于,包括以下步骤: 1将暂态电压控制建模为马尔可夫序贯决策过程模型; 2基于电网暂态电压恢复要求TVRC和负荷节点实时电压演化轨迹,提取马尔可夫序贯决策过程中环境状态量; 3根据影响电压恢复的要素,设计减载量大小和轮次间时延为马尔可夫序贯决策过程中的动作; 4根据动作设计减载智能体和时延智能体,并设计了差异化奖励函数; 5智能体利用与环境交互过程中的生成的基于马尔可夫模型得到的状态-动作-奖励数据集进行集中离线训练; 所述步骤5中,根据减载智能体与时延智能体与电网环境交互的状态中生成的“状态-动作-奖励-下一状态”经验四元组进行离线集中训练,包括: 首先是数据集的构建,智能体依据所在之处感知的暂态电压演变状态,选择减载控制的动作以对电网环境做出针对响应,并观察动作实施下的控制效果得到相应奖励,该动态过程通过Markov建模描述,得到St,At,Rt,St+1四元组构成的序贯数据集,针对负荷站点暂态电压演变轨迹,结合TVRC,提取相应的暂态电压状态-电压幅值偏差ΔVm和恢复时间偏差ΔTr作为状态St,两个智能体依据电压状态分别做出轮次减载量和轮次间时延的动作决策At,并从电网环境中获取对应的奖励Rt和转移到的下一状态St+1,构成减载智能体和时延智能体各自的St,At,Rt,St+1四元组数据集,存放于减载经验池和时延经验池作为训练样本; 在智能体与电网交互收集经验四元组数据集时,动作aCt和aTt使用ε-贪婪算法选择,表达式为: 式中:εC和εT为减载智能体和时延智能体的探索率,ωC和ωT分别为QC和QT的权重参数,aC和aT为减载智能体和时延智能体分别在对应动作空间中可选择的动作; 其次,建立损失函数并从经验池中选取批量数据进行智能体训练,得到动作价值趋于最优的减载智能体和时延智能体,将以上过程基于交互获取的各负荷站点的四元组数据集,进行统一的减载智能体和时延智能体的离线集中式强化学习训练,采用基于时间差分梯度下降算法,不断增大智能体动作获得的奖励,使得智能体应对环境状态选择最优价值动作策略; 智能体通过学习训练以使得智能体响应状态决策出最佳的动作,面向马尔可夫过程,通过最优贝尔曼方程来刻画QC和QT的最大期望价值,综合估计网络和目标网络,基于DoubleDQN的最优贝尔曼方程形成的状态-动作价值函数表达为: 式中:表示期望;RCt和RTt为当前时刻还未观测到智能体的奖励,下一状态下由奖励函数计算出;γC和γT分别为相应智能体的折扣因子;maxQCSt+1,aC;ωC为下一状态St+1下对应QC对应的最大动作价值,maxQTSt+1,aT;ωT为下一状态St+1下QT对应的最大动作价值; 蒙特卡洛方法用于近似随机变量期望,利用时序过程获取的四元组st,at,rt,st+1来表达期望,上述公式11和12,表达为: QCst,aCt;ωC≈rCt+γCmaxQCst+1,aC;ωC13 QTst,aTt;ωT≈rTt+γTmaxQTst+1,aT;ωT14 式中:maxQCst+1,aC;ωC为下一状态st+1下对应QC对应的最大动作价值,maxQTst+1,aT;ωT为下一状态st+1下QT对应的最大动作价值; 结合式13和14,以等式右侧表征为学习目标,即作为强化学习过程的标签量,针对QC和QT分别建立损失函数和表达如下: 式中:yCt和yTt代表QC和QT网络在t时刻的目标值,通过目标网络和真实观测的奖励构成,T为回合结束时间; 利用梯度下降算法,估计网络权重参数ωC和ωT的更新公式表示为: 式中:表示梯度计算;αC和αT分别为减载智能体和时延智能体的学习率; 基于DoubleDQN算法的智能体最优状态-动作价值函数训练,通过式9至10探索动作空间,积累Markov过程中四元组数据构建经验池,当经验池存储的数据样本达到预定存储容量后,智能体从经验池中随机抽取小批量样本数据mini-batch进行离线集中训练,通过式13至22更新智能体的估计网络和目标网络权重参数,实现最小化损失函数,使状态-动作价值估计网络趋近最优; 6经训练学习的减载智能体和时延智能体部署于负荷站点,构成了分散式减载控制结构,自适应决策减载位置、减载量和减载时刻,以最小化减载量促进电压恢复满足暂态电压恢复要求。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北电力大学;华北电力大学,其通讯地址为:132000 吉林省吉林市长春路169号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。