Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆邮电大学王平获国家专利权

重庆邮电大学王平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆邮电大学申请的专利一种基于DQN的工业无线传感网共存调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116113079B

龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310087519.7,技术领域涉及:H04L12/00;该发明授权一种基于DQN的工业无线传感网共存调度方法是由王平;杨晗;蒲宬亘设计研发完成,并于2023-02-03向国家知识产权局提交的专利申请。

一种基于DQN的工业无线传感网共存调度方法在说明书摘要公布了:本发明涉及工业无线传感网,特别涉及一种基于DQN的工业无线传感网共存调度方法,该方法针对工业无线传感网与多种无线网络共存的场景,将工业无线传感网共存问题建模为马尔科夫决策过程,同时设定调度的优化目标为最小化网络中数据信息新鲜度加权和。利用深度强化学习自主学习的特点以及循环神经网络的记忆性,发明了一种基于循环神经网络的DQN动态实时调度方法,该方法在每个时隙开始时利用循环神经网络做出最优决策从而达到共存的目的。本发明提出的调度方法可实现在时域资源有限情况下工业无线传感网与多种无线网络共存,提高了网络利用率,同时以信息新鲜度为优化目标,提高了数据传输的实时性。

本发明授权一种基于DQN的工业无线传感网共存调度方法在权利要求书中公布了:1.一种基于DQN的工业无线传感网共存调度方法,其特征在于,包括以下步骤: S1:根据工业无线传感网的传感器节点个数、信道状态以及传感器节点的信息新鲜度,将工业无线传感网共存调度建模为马尔科夫决策过程; 信息新鲜度的更新公式为: 其中,Δit+1表示节点i在t+1时隙的信息新鲜度,Git表示节点i在t时隙的数据包的生成时间,Git-1表示节点i在t-1时隙的数据包的生成时间,Uit∈{0,1}表示节点i在时隙t是否生成新的数据包,若是,Uit=1,否则Uit=0,当有新的数据包生成时,Git更新为0,否则线性增长;Δit为节点i的信息新鲜度,Xit∈{0,1}表示节点i在时隙t是否被调度,若是,Xit=1,否则Xit=0,Ct∈{0,1}表示节点i在时隙t是成功传输,若是,Ct=1,否则Ct=0;当数据包被调度且成功传输时Δit更新为Git+1,否则信息新鲜度线性增长; 所述步骤S1包括根据工业无线传感网的传感器节点个数确定出马尔科夫决策过程的动作空间,根据工业无线传感网的信道状态和传感器节点的信息新鲜度确定出马尔科夫决策过程的状态空间,根据根据工业无线传感网的传感器节点个数、信道状态以及传感器节点的信息新鲜度,确定出马尔科夫决策过程的收益函数; 动作空间A为: A={0,1,2,…,N} 其中,时隙t的动作为at∈A,表示在t时隙选择该时隙传输数据包的节点,N为节点个数,0代表当前时隙所有节点都不传输; 状态空间S为: S={{Ot-m,…,Ot},{Ot-m+1,…,Ot+1},…} 其中,时隙t的状态St∈S,表示在t时隙的网络状态,由多个时间上连续的m个观测值组成,Ot表示t时隙的观测值,Ot={at,Sct,Δt},Sct表示t时隙动作后的网络中的信道状态,Sct∈{0,1},0代表信道冲突或空闲,1代表数据包成功传输,Δt为t时隙时所有节点信息新鲜度的集合; 收益函数R包括如下: 其中,rt+1表示t+1时隙的收益函数,rt+1∈R,Ix为示性函数,Nmax为最大新鲜度阈值,Δit表示节点i在t时刻的信息新鲜度,ωi为节点i的权重,Xik∈{0,1}为节点i在k时刻是否被调度,为惩罚函数,V为非负控制参数,Uit表示节点i在时隙t是否生成新的数据包; S2:采用基于循环神经网络的DQN算法,构建具有动作选择功能和时序预测功能的深度强化学习工业无线传感网调度器; S3:调度器根据预设的动作选择规则,采用随机方式选择一个动作或者预测得到一个动作;也即是根据动态概率ε在待处理时隙从动作空间中随机选择一个动作,或者根据1-ε的概率基于待处理时隙的前M个连续时隙的信道状态,以最小化网络中信息新鲜度加权和为目标预测得到动作价值,并根据动作价值通过比例公平效用函数得到一个动作; 步骤S3中比例公平效用函数为: 其中,F为比例公平效用函数,即表示为非0动作的动作价值和,qSt,at为网络调度器中预测网络得出在时隙t的状态St下采取动作at的动作价值,qSt,0为在时隙t的状态St下采取动作0的动作价值,N为节点个数; 步骤S3中通过比例公平效用函数得到的一个动作包括: 当F≥lnqSt,0时,时隙t的动作为否则时隙t的动作为at=0,其中为节点信息新鲜度占所有节点信息新鲜度和的比重,修正动作选择时的误差,表示为网络调度器中预测网络得出在时隙t的状态St下采取动作的动作价值,为节点在当前时隙的信息新鲜度,为所有节点信息新鲜度加权和,N为节点个数; S4:将待处理时隙得出的调度策略发送给工业无线传感网的传感器节点,执行调度策略。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。