西安电子科技大学诸文智获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利基于PSO和DDPG算法并行训练的电力网络经济调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119204098B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411143001.1,技术领域涉及:G06N3/045;该发明授权基于PSO和DDPG算法并行训练的电力网络经济调度方法是由诸文智;曹仕康;喻宇聪设计研发完成,并于2024-08-20向国家知识产权局提交的专利申请。
本基于PSO和DDPG算法并行训练的电力网络经济调度方法在说明书摘要公布了:本申请属于人工智能和电力电网调度技术领域。本申请提供一种基于PSO和DDPG算法并行训练的电力网络经济调度方法。本公开实施例采用DDPG算法对电力系统网络进行调度,采用PSO算法对DDPG算法中的模型和训练参数进行寻优,采用最优网络模型和最优参数对DDPG智能体进行训练,增强智能体对于电力网络系统调度任务的适应性,具有更低的计算复杂度和对于高维数据避免了维度灾难。智能体并行训练由于其具有随机性,因此有益于保证最终智能体的鲁棒性。
本发明授权基于PSO和DDPG算法并行训练的电力网络经济调度方法在权利要求书中公布了:1.一种基于PSO和DDPG算法并行训练的电力网络经济调度方法,其特征在于,该方法包括: 利用电力网络拓扑模型分别获取链接拓扑信息、线路参数信息和线性及非线性约束,并基于所述链接拓扑信息、所述线路参数信息和所述线性及非线性约束,构建电网拓扑环境;其中,所述线性及非线性约束包括第一约束和第二约束; 分别获取所述电网拓扑环境中的动作空间和状态空间; 构建整体的奖励函数;其中,所述整体的电力网络系统环境奖励包括电力网络系统的环境奖励和经济负奖励; 利用所述奖励函数、所述动作空间和所述状态空间初始化初始DDPG智能体,并初始定义初始超参数; 利用PSO算法优化DDPG算法中策略网络的神经网络层数和每层神经元个数,以得到策略网络模型; 利用所述PSO算法优化所述初始超参数,以得到适应所述策略网络模型的目标超参数; 以所述策略网络模型作为所述初始DDPG智能体的策略网络,并利用所述目标超参数并行训练所述初始DDPG智能体,以得到训练好的目标DDPG智能体; 输入当前电力网络环境状态至训练好的所述目标DDPG智能体中,以得到调度结果; 分别获取所述电网拓扑环境中的动作空间和状态空间的步骤中,包括: 对所述电网拓扑环境中各设备的所述第一约束进行读取,以得到个可调度设备信息;其中,个所述可调度设备信息包括个发电设备信息、个可调负荷设备信息、个储能设备信息和个无功补偿设备信息; 分别从各个所述发电设备信息、所述可调负荷设备信息、所述储能设备信息和所述无功补偿设备信息中获取个可调节动作维度、个可调节动作维度、个可调节动作维度和个可调节动作维度; 根据所述个可调节动作维度、所述个可调节动作维度、所述个可调节动作维度和所述个可调节动作维度,构建所述初始DDPG智能体的动作空间; 对所述电网拓扑环境中的所述第二约束、所述链接拓扑信息和所述线路参数信息进行读取,以得到个运行状态设备信息;其中,所述运行状态设备信息包括个线路节点信息和个输电支路信息; 分别从各个所述线路节点信息和所述输电支路信息中获取个可观察状态维度和个可观察状态维度; 根据所述个可观察状态维度和所述个可观察状态维度,构建所述初始DDPG智能体的状态空间; 构建整体的奖励函数的步骤中,包括: 利用电力网络系统仿真环境计算时间t下的电力网络潮流状态,并得到各个设备、节点和支路在时间t的状态; 检验所述状态是否违反电力网络系统中所述第一约束和第二约束,并以检验结果作为所述环境奖励; 计算时间t下网络的整体运行费用,并利用负权重对整体运行费用进行加权计算,得到所述经济负奖励; 根据所述环境奖励和所述经济负奖励得到最终的整体的所述奖励函数;其中,; 利用PSO算法优化DDPG算法中策略网络的神经网络层数和每层神经元个数,以得到优化后的策略网络模型的步骤中,包括: 以当前粒子对应位置坐标所对应的输入神经网络层数L和每层神经元个数作为策略网络模型进行训练,将预设回合内获得的奖励总量作为适应度对粒子当前位置进行评估,以得到优化后的所述策略网络模型;其中,奖励和适应度呈线性正比关系; 利用所述PSO算法优化所述初始超参数,以得到适应所述策略网络模型的目标超参数的步骤中,包括: 以所述策略网络模型为基础模型,利用所述PSO算法优化所述初始超参数,以得到适应所述策略网络模型的所述目标超参数;其中,所述超参数包括训练回合数Episode、每回合最大步数Step、学习率Lr、折扣因子Gamma、软更新系数Tau和经验回放池容量BUFFER_CAPACITY; 以所述策略网络模型作为所述初始DDPG智能体的策略网络,并利用所述目标超参数并行训练所述初始DDPG智能体,以得到训练好的目标DDPG智能体的步骤中,包括: 利用同一个所述初始DDPG智能体对不同的独立电力网络仿真环境进行调度; 对各个独立环境动作得到的经验分别进行收集,达到预设数量后基于所述策略网络模型和所述目标超参数,按照所述DDPG算法训练所述初始DDPG智能体; 对每个训练后的所述初始DDPG智能体进行测试,并进行软更新整合以得到所述目标DDPG智能体。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。