哈尔滨工业大学王小刚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于SAC算法的变形飞行器机动轨迹设计方法、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119828724B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411937915.5,技术领域涉及:G05D1/46;该发明授权一种基于SAC算法的变形飞行器机动轨迹设计方法、电子设备及存储介质是由王小刚;李勋;张小帅;鄂斌;王宁宇;姚江川设计研发完成,并于2024-12-26向国家知识产权局提交的专利申请。
本一种基于SAC算法的变形飞行器机动轨迹设计方法、电子设备及存储介质在说明书摘要公布了:一种基于SAC算法的变形飞行器机动轨迹设计方法、电子设备及存储介质,属于飞行器轨迹设计技术领域。为提高在连续动作空间中飞行器的训练稳定性和学习效率,本发明包括构建用于变形飞行器机动轨迹设计的智能体神经网络模型;对变形飞行器在受拦截情况下的机动问题进行马尔可夫过程建模,进行仿真环境设计;收集飞行数据用于变形飞行器机动轨迹设计的智能体神经网络模型;利用SAC算法对用于变形飞行器机动轨迹设计的智能体神经网络模型进行训练,在训练过程中加入自适应探索机制,根据当前的飞行状态和环境条件调整探索的强度,得到训练好的用于变形飞行器机动轨迹设计的智能体神经网络模型;用于飞控回路中实时的轨迹调整和变形决策。
本发明授权一种基于SAC算法的变形飞行器机动轨迹设计方法、电子设备及存储介质在权利要求书中公布了:1.一种基于SAC算法的变形飞行器机动轨迹设计方法,其特征在于,包括如下步骤: S1.构建用于变形飞行器机动轨迹设计的智能体神经网络模型,包括用于生成动作的策略网络π,用于估计每个状态-动作对价值的价值网络Q; S2.对变形飞行器在受拦截情况下的机动问题进行马尔可夫过程建模,进行仿真环境设计,包括设计飞行器状态、动作、奖励函数、飞行器状态转移关系; S3.在步骤S2设计的仿真环境中模拟各种飞行场景,包括不同的初始飞行条件、敌对拦截器的状态、以及不同的目标点,收集飞行数据用于变形飞行器机动轨迹设计的智能体神经网络模型; S4.利用SAC算法对用于变形飞行器机动轨迹设计的智能体神经网络模型进行训练,在训练过程中加入自适应探索机制,根据当前的飞行状态和环境条件调整探索的强度,得到训练好的用于变形飞行器机动轨迹设计的智能体神经网络模型; 步骤S4的具体实现方法包括如下步骤: S4.1.基于SAC算法进行改进,设定智能体在状态st采取动作at后观测到的奖励为Rt,探索加权因子为βst,则改进的探索策略的表达式为: 其中,∈为从高斯分布中采样的随机变量,α是温度参数,用于调节探索与利用之间的平衡;探索加权因子βst基于状态st的访问频率或值函数的方差来动态计算; S4.2.设置延迟奖励的处理方法:在面对延迟奖励时,采用改进的奖励信用分配机制,设置调整后的t时刻的未来奖励Gt,并使用改进的时序差分误差进行值函数的更新,表达式为: Gt=Rt+γRt+1+γ2Rt+2+…+γn-1Rt+n-1+γnQst+n,at+n2 δt=Gt-Qst,at3 其中,γ为折扣因子,n为展望的步数,Rt表示第t步的奖励; S4.3.进行策略网络更新,采用δt对策略网络权值进行更新,更新步骤如下: Qst,at←Qst,at+αδt4 其中,δt为时序差分误差; S4.4.进行价值网络更新,对于步骤S3得到的样本飞行数据进行处理,计算目标值y; 然后使用均方误差更新网络权值; 使用软更新方法分别更新价值网络权值和目标价值网络权值; S4.5.基于训练结果调整和优化算法参数:对熵权重α和软更新系数τ进行调节优化训练综合指标; S5.将训练好的用于变形飞行器机动轨迹设计的智能体神经网络模型部署在机载计算机中,用于飞控回路中实时的轨迹调整和变形决策。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励