武汉大学胡钰林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利一种基于联邦强化学习的多无人机数据收集方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116205390B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310156117.8,技术领域涉及:G06Q10/047;该发明授权一种基于联邦强化学习的多无人机数据收集方法及系统是由胡钰林;高云飞;黄雨茜设计研发完成,并于2023-02-21向国家知识产权局提交的专利申请。
本一种基于联邦强化学习的多无人机数据收集方法及系统在说明书摘要公布了:本发明提出一种基于联邦强化学习的多无人机数据收集方法及系统,包括如下步骤:步骤S1:地面传感器设备收集附近的数据信息,其中数据信息通过地面的传感器设备感知其周围的信息来进行收集;步骤S2:地面中心根据可派遣的无人机数量派遣无人机去收集地面传感器设备的数据;步骤S3:无人机在将所有地面传感设备数据收集的同时以最小化整个系统能量的消耗为目标进行无人机轨迹优化与资源分配;步骤S4:判断是否达到最大训练次数;步骤S5:输出各个无人机最优轨迹以及资源分配情况。本发明通过优化无人机的轨迹和整个系统的通信资源,有效的节约了整个系统的任务完成所需的能量消耗,具有低成本、高速率、低延迟、节能的特点。
本发明授权一种基于联邦强化学习的多无人机数据收集方法及系统在权利要求书中公布了:1.一种基于联邦强化学习的多无人机数据收集方法,其特征在于,包括如下步骤: 步骤S101:地面传感器设备收集附近的数据信息,其中数据信息通过地面的传感器设备感知其周围的信息来进行收集; 步骤S102:地面中心根据可派遣的无人机数量派遣无人机去收集地面传感器设备的数据; 步骤S103:无人机在将所有地面传感设备数据收集的同时以最小化整个系统能量的消耗为目标进行无人机轨迹优化与资源分配; 步骤S104:判断是否达到最大训练次数; 步骤S105:输出各个无人机最优轨迹以及资源分配情况; 对无人机的轨迹优化和整个系统的通信资源进行合理的优化来最小化整个系统的能量消耗,其具体流程如下: 步骤1.各个无人机感知附近的传感器节点,使用贪婪算法选择速率最大的传感器节点作为收集目标,其中,无人机只有将该传感器节点的数据收集完成之后才能收集下一个传感器节点的数据; 步骤2.将所建立的问题转化为马尔科夫决策问题,然后使用联邦强化学习的方法将其进行解决,其中一个完整的马尔可夫决策过程其可由四部分组成,即,其中为状态空间,为动作空间,为无人机执行任务时的状态转移概率,为无人机执行巡检任务时的奖励函数; 步骤3.判断无人机是否完成所有数据收集任务,若否,则执行步骤1,若是,所有数据收集任务结束; 步骤4.判断是否达到最大迭代次数,若否,重复步骤1-3,直至算法达到最大迭代次数,若是,输出最优轨迹和资源分配结果并结束程序;使用联邦强化学习的方法对无人机的轨迹和系统的通信资源进行优化的过程如下: a.假设无人机在时隙的状态为,其从动作空间中采取动作,转移到下一个状态,并获得一个奖励,然后将状态转移的结果保存到经验池中;其中表示无人机在时隙的位置坐标,表示功率离散矩阵,表示无人机的飞行方向,分别表示北、南、东、西,为无人机在时隙+1的状态; b.随机从经验池中选择步样本,并使用梯度下降的方法来减小神经网络的损失函数从而优化无人机的轨迹和通信资源分配,从而获得更大的奖励,其中损失函数定义为 其中表示无人机在时隙获的奖励,表示折扣因子,与表示影响神经网络模型参数的因子,表示current网络中无人机在当前状态采取动作的获得的值,表示在target网络中无人机在当前状态采取动作的值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。