中国人民解放军国防科技大学张建照获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利基于深度强化学习的无人机辅助网络路径优化方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119094975B 。
龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411119870.0,技术领域涉及:H04W4/02;该发明授权基于深度强化学习的无人机辅助网络路径优化方法与系统是由张建照;邓俊荃;熊斯超设计研发完成,并于2024-08-15向国家知识产权局提交的专利申请。
本基于深度强化学习的无人机辅助网络路径优化方法与系统在说明书摘要公布了:本发明涉及电磁频谱技术领域,具体公开了一种基于深度强化学习的无人机辅助网络路径优化方法与系统,其中,该方法包括:构建典型无人机基站下行链路场景,并根据高斯马尔可夫模型模拟用户动态移动的行为;根据所述无人机基站下行链路场景,进行系统建模分析,以最小化能耗为目标,生成联合优化模型;通过深度强化学习算法来求解所述联合优化模型的最优解,该方法融合了双重竞争深度Q网络与想象机制ImaginationMechanism,IM,采用双重Q网络以及竞争结构处理价值函数过度估计问题,并利用IM跨回合传播信息加速网络训练,可动态适应变化的电磁环境和用户需求。
本发明授权基于深度强化学习的无人机辅助网络路径优化方法与系统在权利要求书中公布了:1.一种基于深度强化学习的无人机辅助网络路径优化方法,其特征在于,包括: 步骤S1:构建典型无人机基站下行链路场景,并根据高斯马尔可夫模型模拟用户动态移动的行为; 步骤S2:根据所述无人机基站下行链路场景,进行系统建模分析,以最小化能耗为目标,生成联合优化模型; 步骤S3:通过深度强化学习算法来求解所述联合优化模型的最优解,融合双重竞争深度Q网络与想象机制并利用IM跨回合传播信息加速网络训练; 步骤S3包括: 步骤S31:根据无人机的发射功率和无人机与地面用户在时隙的信噪比确定无人机与用户之间的数据传输速率,并利用闭合解析推进功耗模型确定无人机的能耗; 步骤S32:设置无人机的状态函数、无人机的动作函数和奖励函数; 步骤S33:根据预测Q值和目标Q值之间的误差确定无人机数据在D3QN神经网络的损失,并更新神经网络; 步骤S34:通过IM机制根据无人机的状态函数、无人机的动作函数计算无人机状态动作对之间的差异,以此更新Critic和IM网络; 所述无人机的状态函数为: 式中,u[t]表示用户位置,表示剩余待传输数据量,ω[t]表示无人机位置,ωend表示无人机终点位置,E[t]表示当前时隙剩余能量,Emax表示最大机载能量。 所述用户的动作函数为:+xd,0,0,-xd,0,0,0,+yd,0,0,-yd,0,0,0,+zd,0,0,-zd和0,0,0,分别代表向左、向右、向前、向后、向上、向下和悬停行为。 所述奖励函数包括: r2[t]=-κ2aE[t]-κ2bDsum 式中,κi,i={1,2a,2b,3,4,5}是奖励参数,Dsum是相对于传输数据总和的归一化函数,根据下式确定: 式中,α、β是归一化参数; 根据所述奖励函数确定总的奖惩设计为: 无人机的闭合解析推进功耗模型表示如下: 式中,P0、Pi分别是两个表示悬停状态下叶型功率和诱导功率的常数,Utip是旋翼桨叶的桨尖速度,v0和ν分别是悬停状态下的旋翼感应速度和机身阻力比,ρ和s分别是空气密度和旋翼盘面积,A是旋翼盘面积,V是无人机在时隙t的速度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:210007 江苏省南京市秦淮区后标营路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。