Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学龙腾获国家专利权

北京理工大学龙腾获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利一种强化学习驱动高超声速变体飞行器再入轨迹优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119885812B

龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411657156.7,技术领域涉及:G06F30/27;该发明授权一种强化学习驱动高超声速变体飞行器再入轨迹优化方法是由龙腾;邓钦允;孙景亮;张尧设计研发完成,并于2024-11-19向国家知识产权局提交的专利申请。

一种强化学习驱动高超声速变体飞行器再入轨迹优化方法在说明书摘要公布了:一种强化学习驱动高超声速变体飞行器再入轨迹优化方法,属于高超声速飞行器、轨迹优化领域。本发明实现方法为:基于类别形状转换法CST建立包括乘波体机身与两段变形机翼的类乘波体高超声速变体飞行器参数化模型。考虑飞行高度H,飞行马赫数Ma,攻角α,内翼段后掠角χ1,外翼段后掠角χ2等因素影响,建立Kriging代理模型,获取高超声速变体飞行器气动性能。基于DDPG强化学习算法,根据高超声速变体飞行器在再入段飞行过程中的飞行特点,结合专家经验及飞行过程中动力学、始末状态、热流、过载和动压约束,实现DDPG算法驱动的再入段轨迹优化模型训练。通过不同高超声速变体飞行器飞行仿真预测,实时给出变体决策,实现高超声速变体飞行器的再入段轨迹优化。

本发明授权一种强化学习驱动高超声速变体飞行器再入轨迹优化方法在权利要求书中公布了:1.一种强化学习驱动高超声速变体飞行器再入轨迹优化方法,其特征在于:包括如下步骤: 步骤A:建立高超声速变体飞行器参数化模型; 步骤A实现方法如下: 步骤A-1:构建基准外形和变体形式;根据高超声速变体飞行器再入飞行环境特点,采用类乘波体构型,即乘波体机身结合高超声速机翼外形;由于飞行过程中大气稀薄,采用大尺度变形中的变后掠角提升变体性能; 步骤A-2:参数化描述几何模型;基于标准三维CST描述方程结合类乘波体机身外形特点,结合前缘线位于水平面及纵向平面对称关系,得到机身初始外形上下表面Z坐标表达式,即高超声速变体飞行器参数化模型; 式中,Hu′为展向截面上表面控制参数,为类别函数,Mu′为体轴截面上表面控制参数,Nu′为上表面厚度控制参数,η为X、Y归一化坐标,同理下标l为下表面相关控制参数; 步骤B:建立高超声速变体飞行器六自由度弹道模型; 步骤B实现方法如下: 步骤B-1:在高超声速变体飞行器再入段飞行环境中,需要考虑声速及大气密度变化,故高超声速变体飞行器气动模型受飞行高度H,飞行马赫数Ma,攻角α,内翼段后掠角χ1,外翼段后掠角χ2共同影响;根据飞行环境及飞行器结构特点,在变量范围内采用拉丁超立方试验设计方法生成预定数量采样点: [H,Ma,α,χ1,χ2]=lhsdesignN2式中,N为采样点个数; 通过所得采样点信息进行绘制网格、导入气动仿真软件求解气动力、收集气动力数据一系列自动化流程,获得多组离散的升阻力系数气动系数数据;所述升阻力系数气动系数数据为升力系数CL和阻力系数CD; 步骤B-2:分别对升力系数CL、阻力系数CD分别构造Kriging代理模型; 式中,分别为升力系数和阻力系数的Kriging代理模型拟合函数; 对建立的Kringing代理模型进行留一验证LOOCV,并给出复相关系数; 其中,CLi,CDi为各采样点下通过代理模型获取的升力系数和阻力系数;若任一复相关系数小于0.8,返回步骤B-1增加采样点个数;否则进行步骤B-3; 步骤B-3:根据高超声速变体飞行器在再入段飞行中所经历的飞行环境特点,通过对坐标系的描述与大气模型的描述,选取状态量为旋转地球相对速度v、航迹倾角γ、航向角ψ、经度λ、纬度φ、海拔高度H,构建高超声速变体飞行器六自由度弹道模型; 式中,Re为地球半径,g为重力加速度,采用标称值;σ为倾侧角,值取为0;L为升力加速度,D为阻力加速度,需要进行计算;Cv2为牵连加速度项的相对速度v方向分量,Cγ1和Cγ2分别为哥氏加速度项和牵连加速度项的航迹倾角γ方向分量,Cψ1和Cψ2分别为哥氏加速度项和牵连加速度项的航向角ψ方向分量,表达式为: 式中,ωe为地球自转角速度,采用标称值; 利用式3所得气动数据给出升力加速度L、阻力加速度D; 式中,动压q=0.5ρv2,ρ为标准大气模型给出的大气密度,S为机翼参考面积; 步骤C:确定强化学习算法中状态量、动作量、机体所受约束与始末条件的指向对象;确定强化学习算法中奖励函数形式及专家经验与探索经验组成的经验池;确定强化学习算法中网络架构设置与初始量赋值;训练强化学习算法驱动的再入段轨迹优化模型,得到训练好的强化学习算法驱动的再入段轨迹优化模型,根据训练好的强化学习算法驱动的再入段轨迹优化模型进行轨迹优化; 步骤C实现方法如下: 步骤C-1:将内翼段后掠角χ1、外翼段后掠角、高度H、航迹倾角γ、马赫数Ma与攻角α设置为DDPG强化学习算法中所需基础元素状态量参数s; s=[χ1,χ2,H,γ,Ma,α]8 将内翼段后掠角改变量Δχ1与外翼段后掠角Δχ2改变量设置为DDPG强化学习算法中所需基础元素动作量a; a=[Δχ1,Δχ2]9 状态量参数攻角α随速度阶段性变化如式10: 其中,αmax为最大攻角,αmaxK为最大升阻比下攻角,V1为最大攻角初始速度,V2为最大升阻比对应速度,其余参数如下: 根据最大热流约束、过载约束及动压约束相关约束条件,基于标准阻力加速度剖面,给出再入边界约束模型; 式中,qmax为最大热流约束,n′max为过载约束,q′max为动压约束,Dq,max为最大热流约束下阻力加速度,Dn′,max为过载约束下阻力加速度,Dq′,max为动压约束下阻力加速度; 根据高超声速变体飞行器在再入段飞行过程中的飞行特点、飞行环境特点以及机体本身限制,给出机体起滑参数起滑速度v0、起滑高度H0;初始构型参数内翼段后掠角χ10、外翼段后掠角χ20;机体初始姿态参数航迹倾角γ0,航向角ψ0;机体初始位置参数经度λ0、纬度φ0;其余参数飞行器质量m、机翼参考面积S、地球半径Re、自转速度ωe及地球表面重力加速度g; 采取再入段结束条件终止训练,设置终止速度vs,终止高度Hs; 步骤C-2:建立强化学习训练所需奖励函数R,根据奖励函数R构建结合专家经验的经验池; 考虑最大升阻比的目标函数、变形量的平滑要求与相关约束要求,建立奖励函数R; Rλ1CLDλ2χ1Δχ2λ3ΔDq,n′,q′13 其中,λ1,λ2,λ3为预设权重系数,CLD为升阻比,ΔDq,n′,q′为热流、过载、动压约束超出量; 在训练过程中,将训练进行采样的经验池分为探索经验Eexplore和专家经验Eexpert,引入参数αe作为专家经验采样所占总采样的比率 其中,M为在相应经验池中进行采样的数量; 经验池中的探索经验Eexplore,为智能体在训练轮次中由神经网络输出动作和环境交互后形成的经验,每一轮训练都进行存储,直至达到所设经验池容量上限后实行更新;而经验池中的专家经验Eexpert由于升阻比为主要奖励,故设置为当前状态量下实现最大升阻比的内、外翼段后掠角两个控制量的经验; 步骤C-3:给出强化学习网络架构设置; 建立动作网络Actor和评价网络Critic,网络Critic在输入状态量s动作量a时输出价值函数,用于更新网络Actor;网络Actor由两个初始超参数和结构相同的网络Actor_e和Actor_t构成,Actor_e在输入状态量s时给出输出动作量a;Actor_t在输入下一状态量s′时给出输出下一动作量a′; 网络架构设置完成后,根据步骤C-1所给初始数据确定状态初始值s0及位置状态初始值X0: 其中,Ma0与α0由v0推导计算得出; 步骤C-4:进行完整的DDPG算法架构下的再入段轨迹优化器训练; 网络参数训练步骤如下: 在时刻t,存在动作值at-Δt,状态值st与位置状态值Xt: 其中,下标t表示该变量在时刻t的取值; 将变量Ht,αt,Mat,χ1t,χ2t代入式3获取当前时刻的气动系数CLt,CDt;将当前时刻的气动系数CLt,CDt代入式7获取当前时刻的升力加速度Lt、阻力加速度Dt;将Lt、Dt与Xt代入式5,采用龙格库塔4阶积分器获取下一时刻位置状态值Xt+Δt,Δt为设置的特定时间步长;将位置状态值Xt+Δt中vt+Δt代入式10获取αt+Δt,代入标准模型获取Mat+Δt;将st传入网络Actor中获取at,at如下式: at=[Δχ1t,Δχ2t]17 得到关系式: 将at代入式18,采用龙格库塔4阶积分器获取下一时刻χ1t+Δt,χ2t+Δt,整合位置状态值Xt+Δt中已获取参数Ht+Δt,γt+Δt给出st+Δt;将动作值at与状态值st传入网络Critic中,给出价值函数,对网络Actor进行更新,完成完整的时刻t下训练过程;在t=0时,有下式: 传入初始值开始训练后,不断重复网络参数训练步骤直至达到训练结束条件,即: 训练条件满足后,此次训练过程记为一次训练,训练次数i=i+1;设定训练迭代上限imax,当i=imax时结束训练,输出得到训练好的强化学习算法驱动的再入段轨迹优化模型,根据训练好的强化学习算法驱动的再入段轨迹优化模型进行轨迹优化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。