当前位置 : 首页 > 专利喜报 > 南京邮电大学郭永安获国家专利权

南京邮电大学郭永安获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉南京邮电大学申请的专利一种基于深度强化学习的物联网边缘协同缓存方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN116346837B 。

龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310296228.9，技术领域涉及：H04L67/1097；该发明授权一种基于深度强化学习的物联网边缘协同缓存方法是由郭永安;周沂;王宇翱;钱琪杰设计研发完成，并于2023-03-24向国家知识产权局提交的专利申请。

本一种基于深度强化学习的物联网边缘协同缓存方法在说明书摘要公布了：本发明提出一种基于深度强化学习的物联网边缘协同缓存方法，该方法包括：1边缘服务器收集终端层用户设备的视频缓存信息，构建数据集，2分布式边缘服务器通过模型训练模块训练数据集；3中心服务器接收各分布式边缘服务器的局部梯度参数进行参数聚合，得到全局梯度参数；4中心服务器通过参数训练模块，输入拟合后的全局梯度参数经过神经网络的训练，输出更新后的全局模型参数；5重复1‑4，得到在线视频请求的预测模型，并进行视频内容请求预测，获得用户在线视频请求的预测列表；6根据得到的用户在线视频请求的预测列表，多个分布式边缘服务器进行协作缓存，直至各分布式边缘服务器达到存储上限。

本发明授权一种基于深度强化学习的物联网边缘协同缓存方法在权利要求书中公布了：1.一种基于深度强化学习的物联网边缘协同缓存方法，其特征在于，该方法包括以下步骤：步骤一：边缘服务器收集所在区域的终端层用户设备的视频缓存信息，构建动态日志文件数据集，数据集元素包括视频用户ID、时间戳、视频内容ID；步骤二：各分布式边缘服务器通过模型训练模块训练数据集，模型训练模块的神经网络输入为包含视频用户ID、时间戳、视频内容ID标签的动态日志文件数据集，经过训练，模型训练模块输出包含边缘服务器缓存信息的局部梯度参数同步转发给中心服务器及相邻的边缘服务器；分布式边缘服务器中的神经网络是为了得到局部梯度参数该参数反映边缘服务器的缓存状态；步骤三：中心服务器接收到各分布式边缘服务器发送的局部梯度参数后，经过参数聚合模块对局部梯度参数进行聚合，得到全局梯度参数Gτ；各分布式边缘服务器通过协作共享模块，共享彼此的局部梯度参数以实现各边缘服务器之间的缓存信息交互；步骤四：中心服务器通过参数训练模块，输入拟合后的全局梯度参数Gτ，经过神经网络的训练，输出更新后的全局模型参数ωτ，中心服务器的神经网络是为了得到全局模型参数ωτ，该参数进一步优化边缘服务器中的神经网络；中心服务器将全局模型参数ωτ发送给各分布式边缘服务器，进行新一轮的局部梯度参数全局梯度参数Gτ、全局模型参数ωτ的更新；步骤五：重复步骤一到步骤四，直至预测模型收敛，得到视频用户在线视频请求的预测模型，并进行视频内容请求预测，获得用户在线视频请求的预测列表；训练之后的预测模型进行自动更新；步骤六：根据预测模型得到的用户在线视频请求的预测列表，多个分布式边缘服务器进行协作缓存，直至各分布式边缘服务器达到存储上限；步骤二的具体方法如下：步骤2.1，数据集划分，将标签分类后的动态日志文件数据集Xm划分为具有最小批量大小的子集，β表示训练数据集分成的批次大小，M表示边缘服务器个数；步骤2.2，生成输出矩阵，对于DNN神经网络，分布式边缘服务器生成输出矩阵：其中，是分布式边缘服务器中的神经网络第l层的输入矩阵，αm是边缘服务器中的整流线性单元激活函数，用于将每层神经网络的输入转换为非线性模式，定义覆盖所有DNN层的全局模型参数ω，ω＝W,v，W＝[W1,…,Wl,…,WL]和v＝[v1,…,vl,…,vL]，Wl是全局权重矩阵，vl是全局偏置向量，L表示神经网络层数；步骤2.3，计算预测损失函数，在输出层生成用于找到边缘服务器m最小批迭代次数τ的预测损失pmωτ：其中，ωτ表示在完成最小批迭代次数τ时的全局模型参数；是分布式边缘服务器输入矩阵的元素，是分布式边缘服务器输出矩阵的元素；步骤2.4，计算局部梯度参数；通过计算：由此得出分布式边缘服务器的局部梯度参数步骤三的计算全局梯度参数Gτ的公式如下：步骤四的具体步骤如下：步骤4.1，计算学习步长λ，基于中心服务器的参数训练模块部署的神经网络，以及全局梯度参数，将ητ和δτ分别视为Gτ和的指数移动平均值，用于估计均值，以预测当前样本迭代τ处的方差，ητ+1和δτ+1的更新公式如下：其中，和分别表示ητ和δτ在τ处的指数衰减步长，为了更新全局模型参数ωτ，加入学习步长λ，以决定在每个迭代过程τ更新全局模型ωτ的速度，学习步长λ的更新公式如下：步骤4.2，计算下一个迭代过程τ+1的全局模型参数ωτ+1：其中，ωτ+1用于边缘服务器学习下一个τ+1的数据集，ε表示常数；步骤4.3，将预测的全局模型参数ωτ+1发送给各分布式边缘服务器，进行新一轮的局部梯度参数全局梯度参数Gτ和全局模型参数ωτ的更新。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人南京邮电大学，其通讯地址为：210003 江苏省南京市鼓楼区新模范马路66号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

南京邮电大学郭永安获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务