中国科学院计算技术研究所王琪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院计算技术研究所申请的专利基于深度强化学习的实时集中式无线网络调度方法和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114189937B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111327752.5,技术领域涉及:H04W72/0446;该发明授权基于深度强化学习的实时集中式无线网络调度方法和设备是由王琪;何晨涛;黄建辉;徐勇军设计研发完成,并于2021-11-10向国家知识产权局提交的专利申请。
本基于深度强化学习的实时集中式无线网络调度方法和设备在说明书摘要公布了:本发明提出一种基于深度强化学习的实时集中式无线网络调度方法和系统,包括:获取由一个接入点和多个用户节点互连组成的无线网络,在每个时隙,接入点根据所有数据流对应的发送队列信息,得到各数据流的状态,集合所有数据流的状态构成当前时隙的环境状态,接入点获取所有数据流的流量模型与链路质量作为环境特征信息,将环境状态和环境特征信息输入至决策模型,接入点执行决策模型输出结果对应的调度决策;接入点执行调度决策后,收到网络环境的反馈;将交互信息和环境状态和环境特征信息作为经验,存储至子区域;从经验回放池中抽取经验,以训练更新当前决策模型。本发明训练时间不会随数据流数量增加而快速增长,能够快速的收敛到最优实时吞吐量。
本发明授权基于深度强化学习的实时集中式无线网络调度方法和设备在权利要求书中公布了:1.一种基于深度强化学习的实时集中式无线网络调度方法,其特征在于,包括: 步骤1、获取由一个接入点和多个用户节点互连组成的无线网络,接入点调度该无线网络中的所有数据流,该无线网络中接入点在与网络环境交互前,在经验回放池中新建一个子区域; 步骤2、该接入点与网络环境交互时,在每个时隙,该接入点根据所有数据流对应的发送队列信息,得到各数据流的状态,集合所有数据流的状态构成当前第t个时隙的环境状态st,同时,该接入点获取所有数据流的流量模型与链路质量作为环境特征信息,将该环境状态和该环境特征信息输入至决策模型,该接入点执行该决策模型输出结果对应的调度决策at; 步骤3、该接入点执行调度决策at后,收到网络环境的反馈rt和终止标识endt,所有数据流的状态更新至st+1;将交互信息st,at,rt,st+1,endt和该环境状态和该环境特征信息作为经验,存储至该子区域; 步骤4、从该经验回放池中抽取经验,以训练更新当前该决策模型; 其中,该数据流的状态由该数据流待调度的紧急程度与该数据流的数据包到达因子组成; 该决策模型的训练过程包括: 创建两个具有相同结构的神经网络,分别为当前网络和目标网络,当接入点需要做出调度决策时,会将当前时隙t的环境状态和环境特征信息输入至该目标网络,得到各调度动作的价值,接入点以ε的概率随机选取一个动作执行调度,以1-ε的概率选择价值最高的动作执行调度,ε为0到1之间的小数, 当接入点执行动作at后,得到反馈rt和终止标识endt,环境状态更新至st+1;将交互信息st,at,rt,st+1,endt存储到该经验回放池,其中,endt是终止表示符,当t≥L*Prd且t%Prd=0时,endt=true,否则endt=false,L是恒定的正整数,满足: L*Prd≥maxk∈[1,K]offsetk+Dk 其中,Prd是所有数据流周期的最小公倍数,Dk表示数据流k中数据包的截止期限,offsetk表示数据流k的首个数据包到达时间与网络开始时间的偏移量,当endt=true时,接入点与当前训练环境的交互过程结束,开始与另一个训练环境进行交互; 从经验回放池中随机抽取部分交互信息后,通过最小化损失函数来更新该当前网络的参数,目标网络的参数θtarget每隔预定时间,会被该当前网络的参数θcurrent所覆盖,达到预设训练时长后,保存当前目标网络作为该决策模型; ε的计算方法如下: 其中,ε0=0.99,εmin=0.001,train_time指接入点已经交互的环境的数量,初始值为0,当接入点与一个环境交互结束后,该值加1。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算技术研究所,其通讯地址为:100080 北京市海淀区中关村科学院南路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。