Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国电力科学研究院有限公司;国网黑龙江省电力有限公司电力科学研究院;国家电网有限公司蒲天骄获国家专利权

中国电力科学研究院有限公司;国网黑龙江省电力有限公司电力科学研究院;国家电网有限公司蒲天骄获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国电力科学研究院有限公司;国网黑龙江省电力有限公司电力科学研究院;国家电网有限公司申请的专利多微网系统分层强化学习优化方法、系统以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115115211B

龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210724939.7,技术领域涉及:G06Q10/0631;该发明授权多微网系统分层强化学习优化方法、系统以及存储介质是由蒲天骄;王新迎;陈盛;闫冬;武国良设计研发完成,并于2022-06-24向国家知识产权局提交的专利申请。

多微网系统分层强化学习优化方法、系统以及存储介质在说明书摘要公布了:一种多微网系统分层强化学习优化方法、系统以及存储介质,优化方法包括:将多微网优化问题分解为上下两层;构建提供各微网内的储能策略以及微网之间的功率交互策略的上层智能体模型;构建实现下层各微网基于上层储能策略以及功率交互策略对微网内设备出力自治优化,并向上层反馈优化目标值来指导上层策略更新的下层自治优化模型;协同训练下层自治优化模型与上层智能体模型;利用训练完成的下层自治优化模型与上层智能体模型根据系统状态即时给出调度策略。本发明将深度强化学习方法与传统数学规划法相结合,充分利用了强化学习法自适应能力强以及数学规划法求解精度高的优势,能够针对多微网优化问题实现高效求解,收敛速度和精度均有大幅提升。

本发明授权多微网系统分层强化学习优化方法、系统以及存储介质在权利要求书中公布了:1.一种多微网系统分层强化学习优化方法,其特征在于,包括: 将多微网优化问题分解为上下两层; 构建提供各微网内的储能策略以及微网之间的功率交互策略的上层智能体模型; 构建实现下层各微网基于上层储能策略以及功率交互策略对微网内设备出力自治优化,并向上层反馈优化目标值来指导上层策略更新的下层自治优化模型; 协同训练下层自治优化模型与上层智能体模型; 利用训练完成的下层自治优化模型与上层智能体模型根据系统状态即时给出调度策略; 所述构建提供各微网内的储能策略以及微网之间的功率交互策略的上层智能体模型的步骤,包括: 构建智能体状态空间和动作空间; 构建智能体奖惩函数; 构建智能体网络; 所述构建智能体状态空间和动作空间的步骤,所构建的智能体状态空间包括各微网的可再生能源预测出力、储能荷电状态、分时电价信息以及冷、热、电负荷功率:所构建的智能体动作空间为相关控制变量,包括各微网间的交互功率以及各微网的储能充放电功率; 所述构建智能体奖惩函数的步骤,构建得到的智能体奖惩函数表达式如下: 式中,π*为当前优化策略;γt为时间奖励的折扣因子;r为奖励函数;st为t时间断面的状态;at为t时间断面的动作;α为温度系数,α>0,用于确定策略熵项相对于奖励重要性的比重;H为在状态st下策略采取动作的熵,计算表达式如下: 奖励函数r包含运行成本以及动作约束越限惩罚两大类; 所述运行成本的计算表达式为: 式中,fMG,t为多微网系统在T时段的综合运行成本; 所述动作约束越限惩罚对于储能的运行约束包括:荷电量状态约束、充放电功率约束、调度周期始末能量平衡约束,表达式分别如下: SOCmin≤SOCt≤SOCmax 0≤Pcht≤λch,tPch,max 0≤Pdist≤1-λch,tPdis,max λch,t∈{0,1} SOC0=SOCT 式中,SOCmin、SOCmax分别为蓄电池荷电状态的上、下限;Pch,max、Pdis,max分别为蓄电池最大充放电功率;λch,t为表示蓄电池在t时段的充放电状态系数; 各微网的功率交互满足上下限约束,表达式为: Pij,mg,min≤Pij,mgt≤Pij,mg,max 式中,Pij,mg,min、Pij,mg,max分别为微网i与微网j交互功率的上、下限; 将输出动作经过tanh函数限制在[-1,1]之间,再通过线性变换满足荷电量状态约束; 添加以下惩罚项保证满足充放电功率约束、调度周期始末能量平衡约束: φ2=k2|SOC0-SOCT| 式中,k1、k2为惩罚系数; 最终智能体的奖励函数如下: Rt=-f+φ1+φ2。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电力科学研究院有限公司;国网黑龙江省电力有限公司电力科学研究院;国家电网有限公司,其通讯地址为:100192 北京市海淀区清河小营东路15号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。