Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安交通大学高贞贞获国家专利权

西安交通大学高贞贞获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安交通大学申请的专利基于多智能体强化学习的多小区分布式调度方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116347477B

龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310307473.5,技术领域涉及:H04L67/00;该发明授权基于多智能体强化学习的多小区分布式调度方法及系统是由高贞贞;白少壮;廖学文设计研发完成,并于2023-03-27向国家知识产权局提交的专利申请。

基于多智能体强化学习的多小区分布式调度方法及系统在说明书摘要公布了:一种基于多智能体强化学习的多小区分布式调度方法及系统,调度方法包括根据3GPP对预先建立的多小区蜂窝网络系统模型设置衡量多小区多用户QoS的指标;由衡量多小区多用户QoS的指标以最大化系统体验速率建立优化目标模型;求解优化目标模型获得多小区分布式调度的最优策略。本发明让每个基站训练自己的深度Q学习网络DQN,输入信息包括包含信道状态信息和队列长度信息,利用转化的瞬时指标作为奖励训练,输出最优的调度用户索引集合来达到低信息开销、高性能的目的。本发明调度方法首先在调度单用户场景下设计了针对系统体验速率的网络三要素,再将三要素设计扩展到调度多用户场景,并针对调度多用户场景设计了更有效的网络结构。

本发明授权基于多智能体强化学习的多小区分布式调度方法及系统在权利要求书中公布了:1.一种基于多智能体强化学习的多小区分布式调度方法,其特征在于,包括: 根据3GPP对预先建立的多小区蜂窝网络系统模型设置衡量多小区多用户QoS的指标; 由衡量多小区多用户QoS的指标以最大化系统体验速率建立优化目标模型; 求解优化目标模型获得多小区分布式调度的最优策略; 所述的多小区蜂窝网络系统模型中有个小区,每个小区中有一个配备个发射天线的基站和个配备个接收天线的用户,,每个用户与其它小区中的用户共享相同的频带,若基站在每个时隙内只服务单个用户,基站使用SVD预编码,若基站在每个时隙可服务多个用户,基站使用块对角化BD预编码;第个基站的第个用户的接收信号为: 其中,表示基站到基站服务的第个用户的信道状态信息,表示基站发送给第个用户的预编码矩阵,表示基站发送给第个用户的符号矢量,表示基站服务的第个用户处的噪声,服从均值为0方差为的复高斯分布;,表示基站分给第个用户的第个流的功率;表示基站到除第个用户以外其他所有服务用户的信道矩阵,表达式如下: 其中,为当前时隙基站调度用户总数,天线数满足约束,,对信道按下式进行SVD分解: 其中,,,是的一个正交基,基站到基站服务的第个用户的等效信道为,通过BD预编码算法对做如下SVD分解: 其中,的前列包含有的右边奇异相量,定义的前列为,由此得到预编码矩阵,,,对角元素为矩阵的个奇异值;在接收端,第个基站的第个用户使用矩阵来进行接收加权,加权后的接收信号为: 上式右边第一项为有用信号,第二项为小区间干扰,第三项为噪声,由此得到基站服务的第个用户的第个流的信干噪比为: 其中表示噪声功率,表示向量的2范数,表示基站到基站服务的第个用户的干扰矩阵,表示矩阵的第行元素,为基站的所有流到基站服务的第个用户的第流的干扰功率向量;基站通过功率注水进行功率分配,因此, 对于符号表示取0和的较大值,则: 其中,表示基站的最大可用功率,基站服务的第个用户的速率为: 表示基站服务的第个用户的队列长度,则用户实际速率为: 表示用户实际速率不超过用户队列长度; 用户队列更新规则如下: 其中,表示基站服务的第个用户在第个时隙到达的数据包数量,的大小服从泊松分布,到达间隔服从指数分布; 所述衡量多小区多用户QoS的指标结合3GPP的显示用户服务质量的关键性能指标与衡量时延的指标得出; 所述3GPP的显示用户服务质量的关键性能指标,计算表达式如下: 其中,是成功传输的数据包大小,是从传输开始到用户队列为空的时间; 所述3GPP的衡量时延的指标,计算表达式如下: 其中,是采样的个数,是从数据到达到第一次被调度的时间; 所述衡量多小区多用户QoS的指标,计算表达式如下: 其中,表示截止第个时隙基站服务的第个用户的总传输时间和等待时间,即截止第个时隙基站服务的第个用户队列不为空的时间; 所述由衡量多小区多用户QoS的指标以最大化系统体验速率建立优化目标模型包括: 优化目标是最大化系统体验速率,计算表达式如下: 最大化系统体验速率等价于最小化总传输时延: 在不考虑数据未来到达的基础上,设当前系统中第个传输完成的用户队列初始长度为,第个传完的用户在第个时隙的瞬时速率为,第个传完的用户从第个时隙到第个时隙的平均速率为,第个传完的用户在第个用户传输完成之后还需传输的时间为,则第一个传输完成的用户所用时间为,第二个传输完成的用户所用时间为;第个传输完成的用户所用时间为,因此,整个系统传输的总时延为: 其中,,所以优化目标模型为: 所述求解优化目标模型获得多小区分布式调度的最优策略的步骤中,若每个基站在每个时隙只调度单个用户,则每个基站设置一对DQN网络,包括以下步骤: 动作设置:动作为每个基站所调度的用户索引,基站的动作设置为: 其中,为基站在第个时隙调度的用户索引; 状态设置:状态包括所有用户的信道状态信息和队列长度信息,将所有用户的虚拟传输时间作为状态输入网络,基站的状态设置为: 其中,表示基站服务的第个用户的历史平均传输速率,式中每个元素的分母包含了对应用户的信道状态信息的信息,分子包含了队列长度信息; 奖励设置:瞬时奖励为两部分之和,第一部分是每个基站动作的独立奖励,另外一部分是所有基站动作的独立奖励之和;优化目标为: 当第个时隙传输完成后,优化目标为: 式中,分子是当前时隙第个完成传输的用户的队列长度,分母是未来个时隙第个完成传输的用户的平均传输速率,由未来决策决定,是第个完成传输的用户的优先级因子; 根据优化目标确定第个时隙第个基站的瞬时奖励获得对应调度用户的动作; 所述求解优化目标模型获得多小区分布式调度的最优策略的步骤中,若每个基站服务多个用户,每个基站设置对DQN网络,包括以下步骤: 动作设置:设为当前时隙基站队列不为空的用户数,每个基站执行个DQN网络,每个DQN网络输出一个调度用户索引,结合所有网络动作就是对应基站调度用户集合,基站的所有网络输出为: 式中,为基站的第个网络输出的动作,为基站的第个网络输出的调度用户索引; 状态设置:多用户DQN网络状态包括所有用户的信道状态信息、队列长度信息以及对应基站之前调度用户索引,基站的第个DQN网络的状态为: 其中,表示基站服务的第个用户的历史平均传输速率,式中每个元素的分母包含了对应用户的信道状态信息的信息,分子包含了队列长度信息; 奖励设置:基站的第个DQN网络的奖励为: 式中,为第个基站服务的第个用户的优先级因子,为基站服务的第个用户的速率,为基站服务的第个用户的历史平均传输速率。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安交通大学,其通讯地址为:710049 陕西省西安市碑林区咸宁西路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。