浙江理工大学王洪雁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江理工大学申请的专利基于先验知识嵌入的LSTM-PPO模型的智能干扰决策方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118818440B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410785431.7,技术领域涉及:G01S7/38;该发明授权基于先验知识嵌入的LSTM-PPO模型的智能干扰决策方法及系统是由王洪雁;杨凯;彭俊;冯慧妹;姚岚设计研发完成,并于2024-06-18向国家知识产权局提交的专利申请。
本基于先验知识嵌入的LSTM-PPO模型的智能干扰决策方法及系统在说明书摘要公布了:本发明公开一种基于先验知识嵌入的LSTM‑PPO模型的智能干扰决策方法及系统,属于人工智能和机器学习领域;其方法包括对多功能雷达环境MFR进行建模,得到环境模型;将MFR干扰决策问题定义为马尔可夫决策过程;基于环境模型的势能函数的重塑奖励理论将先验知识以重塑奖励的形式嵌入PPO模型,以引导智能体快速收敛;使用LSTM代理PPO算法嵌入强化学习模型,用于捕捉回波数据的动态特征以有效刻画雷达工作状态,提升干扰决策精度和稳定性。本发明具有较高的决策效率以及有效性,因而可高效稳健地达成多功能雷达干扰策略。本发明可以基于多功能雷达环境下在算法的收敛速度、稳定性以及执行干扰决策的性能方面均有显著优势。
本发明授权基于先验知识嵌入的LSTM-PPO模型的智能干扰决策方法及系统在权利要求书中公布了:1.基于先验知识嵌入的LSTM-PPO模型的智能干扰决策方法,其特征在于,具体包括: 对多功能雷达环境MFR进行建模,得到环境模型; 将MFR干扰决策问题定义为马尔可夫决策过程MDP; 基于环境模型的势能函数的重塑奖励理论将先验知识以重塑奖励的形式嵌入PPO模型,以引导智能体快速收敛,具体为:智能体接近目标状态时,势能函数值逐渐变小,所构造势能函数Φst具有非负性,因此在重塑奖励函数中,当智能体状态符合领域先验信息时,重塑奖励函数将智能体接近目标状态时所损失势能作为正奖励,将远离先验信息目标状态时所增加势能作为负奖励,从而确保智能体能够沿着先验信息方向学习策略,由此构造如下重塑奖励函数: 结合所构造奖励函数R1,R2以及重塑奖励函数Ust,st+1以获得如下所示新的奖励函数从而加速智能体学习进程: R′1,2st,st+1=R1,2st,st+1+α·ΔUst,st+110 式中,R1,2st,st+1为原始奖励函数,ΔUst,st+1为势能变化,α为标量权重,用于调整势能变化对重塑奖励的影响程度;st为当前状态,st+1为下一状态; 使用LSTM代理PPO算法嵌入强化学习模型,用于捕捉回波数据的动态特征以有效刻画雷达工作状态,提升干扰决策精度和稳定性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江理工大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街928号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励