北京航空航天大学刘荣科获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学申请的专利基于强化学习的无人机群通感一体能耗优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116896777B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310843486.4,技术领域涉及:H04W52/02;该发明授权基于强化学习的无人机群通感一体能耗优化方法是由刘荣科;祝倩;刘启瑞设计研发完成,并于2023-07-11向国家知识产权局提交的专利申请。
本基于强化学习的无人机群通感一体能耗优化方法在说明书摘要公布了:本发明提出一种基于强化学习的无人机群通感一体能耗优化方法,包括如下步骤:一,利用无人机集群的定位感知性能,为反映状态与动作关系的Q值函数网络赋初值;二,判断当前状态;选定某一工作点作为初始状态;三,根据当前状态,基于ε‑greedy策略来选择当前动作;四,将无人机感知性能和通信任务能量消耗引入Reward奖励函数的设计中,并获取上一步动作的实际环境奖励值,以及下一个状态;五,利用上一步动作的实际环境奖励值,更新Q值函数网络;六,将新状态设置为当前状态,重复三~六,直到Q值函数网络中的值达到收敛。本发明能解决现有技术在基于无人机群的ISAC网络中能耗较大的问题,同时保障终端地面用户的通信和定位的实时服务性能,有效改善网络服务寿命。
本发明授权基于强化学习的无人机群通感一体能耗优化方法在权利要求书中公布了:1.一种基于强化学习的无人机群通感一体能耗优化方法,其特征在于:包括如下步骤: 第一步,利用无人机集群的定位感知性能,为反映无人机状态与动作关系的Q值函数网络赋初值; 第二步,从环境中判断无人机的当前状态;选定某一工作点作为无人机的初始状态; 第三步,根据无人机当前状态,基于ε-greedy策略来选择当前动作; 第四步,将无人机感知性能和通信任务能量消耗引入Reward奖励函数的设计中,并获取上一步动作的实际环境奖励值,以及无人机下一个状态; 第五步,利用上一步动作的实际环境奖励值,更新Q值函数网络; 第六步,将新状态设置为当前状态,重复第三步~第六步,直到Q值函数网络中的值达到收敛; 其中,Q值函数网络赋初值为:设在时刻t,为用户-l提供定位感知服务的无人机基站子集为Skt,且设集合中无人机个数为M0个;则计算该无人机子集的位置精度因子值,表示为: 上式中,是无人机基站子集Skt的定位感知观测方程的雅可比矩阵; 其中,基于ε-greedy策略来选择当前动作为:智能体随机进行动作选择的概率为ε,选择Q值函数网络中值的最大值对应的动作的概率为1-ε; 当开始执行时,首先利用公式1中方法进行Q-table的初始化,之后选择当前状态st,对于该状态下的每一个动作a,其都存在一个对应的“状态-动作”值,并表示为Qst,a;在此情况下,依据ε-greedy策略来选择该状态下的动作,即选择Q值函数网络中值的最大值对应的动作,如下式所示:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。