东南大学彭剑坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利嵌入模仿学习的学习型燃料电池混动汽车能量管理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117993293B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410130880.8,技术领域涉及:G06F30/27;该发明授权嵌入模仿学习的学习型燃料电池混动汽车能量管理方法是由彭剑坤;任廷辉;陈志军;陈伟琪;吴长城;马春野设计研发完成,并于2024-01-31向国家知识产权局提交的专利申请。
本嵌入模仿学习的学习型燃料电池混动汽车能量管理方法在说明书摘要公布了:本发明公开了嵌入模仿学习的学习型燃料电池混动汽车能量管理方法,包括:构建仿真环境、构建训练工况和测试工况;基于动态规划,提取训练工况的全局最优轨迹;使用模仿学习算法对全局最优轨迹进行模仿,获得可继承的神经网络参数;将通过模仿学习算法取得的神经网络作为深度强化学习算法的初始化策略网络,开始强化学习训练,直到深度强化学习算法收敛。本发明充分结合了基于优化的方法与深度强化学习方法的优点,弥补了传统深度强化学习算法的不足,能够提高训练效率和优化效果。
本发明授权嵌入模仿学习的学习型燃料电池混动汽车能量管理方法在权利要求书中公布了:1.嵌入模仿学习的学习型燃料电池混动汽车能量管理方法,其特征在于,包括: 1构建仿真环境,搭建FCHEV模型,包括FCHEV的动力系统结构、燃料电池氢耗模型和寿命模型,以及动力电池电-热-寿命耦合模型,其中动力电池电-热-寿命耦合模型包括二阶RC电模型、双态热模型和能量吞吐量老化模型;构建训练数据,包括训练工况和测试工况; 2建立基于FCHEV模型与FCHEV能量管理策略的强化学习环境,设定状态空间、动作空间和奖励函数;基于动态规划,提取训练工况的全局最优轨迹; 3使用模仿学习算法,对全局最优轨迹进行模仿,获得可继承的神经网络参数; 4将对全局最优轨迹充分模仿后的神经网络,作为深度强化学习算法的初始化策略网络,开始强化学习训练直到奖励函数收敛; 步骤4中,深度强化学习算法采用近端策略优化PPO,具体包括: 4-1将经过行为克隆算法充分模仿的Actor网络作为PPO的初始化策略网络,同时随机初始化价值网络; 4-2令每一次策略更新前的策略为πold,πold与环境进行固定步数的交互,得到多个状态-动作对s,a; 4-3计算对于所有状态-动作对s,a,状态s下特定动作a与从策略πold·|s中随机选择的动作相比所能获得总奖励的相对改善 4-4对策略网络的代理目标函数进行优化,目标函数L表示为: 其中,πθ表示由当前策略更新得到的被θ参数化的新策略网络,πold表示上一次策略更新后得到的旧策略网络,式26中使用剪裁阈值∈≥0来控制每次策略更新的大小,计算梯度并通过梯度下降法解决下列最优化问题来不断更新策略网络的参数θ: 4-5对价值网络的目标函数进行优化,其优化目标为: 其中,VΦ表示由φ参数化的PPO价值网络,计算梯度同样通过梯度下降法来更新价值网络的参数φ: 4-6重复步骤4-2至4-5,直到达到预先设定的最大迭代次数,训练结束,然后保存并下载神经网络参数; 5将训练得到的参数化神经网络策略加载到FCHEV的整车控制器中,实现实时在线应用;目标域FCHEV执行训练完成的能量管理策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211189 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。