当前位置 : 首页 > 专利喜报 > 中国矿业大学熊梦辉获国家专利权

中国矿业大学熊梦辉获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉中国矿业大学申请的专利一种基于Bandit反馈的量化分布式在线近端梯度下降优化方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN121078462B 。

龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202511606204.4，技术领域涉及：H04W24/02；该发明授权一种基于Bandit反馈的量化分布式在线近端梯度下降优化方法是由熊梦辉;杨春雨;周林娜;张莹;刘金浩;王国庆设计研发完成，并于2025-11-05向国家知识产权局提交的专利申请。

本一种基于Bandit反馈的量化分布式在线近端梯度下降优化方法在说明书摘要公布了：本发明属于分布式在线优化与学习技术领域，公开了一种基于Bandit反馈的量化分布式在线近端梯度下降优化方法。该方法旨在解决在通信资源受限且网络结构非平衡的条件下，损失函数梯度信息难以获取甚至无法获取时的分布式在线复合优化问题。技术方案包括：非平衡网络图构建与节点邻域关系确定，基于Bandit反馈的分布式在线复合优化问题建模，结合自适应均匀量化策略与近端梯度下降技术的量化分布式在线近端梯度下降算法设计，以及该算法的静态遗憾分析。

本发明授权一种基于Bandit反馈的量化分布式在线近端梯度下降优化方法在权利要求书中公布了：1.一种基于Bandit反馈的量化分布式在线近端梯度下降优化方法，其特征在于，包括以下步骤： S1、非平衡网络图构建：基于无线传感器网络中通信节点的连接关系，构建表征节点间信息交互的网络图模型，并确定每个节点的入邻居集合与出邻居集合； S2、Bandit反馈下的分布式在线复合优化建模：将无线传感器网络中的稀疏事件检测问题表述为Bandit反馈下的分布式在线复合优化模型，定义其决策变量、局部时变损失函数、非光滑正则化项以及可行约束集； S3、量化分布式在线近端梯度下降算法设计：基于所述优化模型，融合非平衡网络图、均匀量化策略与近端梯度下降方法，构造适用于带宽受限非平衡网络的量化分布式在线近端梯度下降算法； S4、算法收敛性分析：以静态遗憾作为性能评价指标，对所述算法的收敛行为进行理论分析，并建立其静态遗憾上界；所述S2具体包括以下步骤： S21、定义节点的决策变量为，其中表示维实向量空间； S22、定义为所有通信节点均共享且已知的非空凸集合约束，其中表示维实向量空间； S23、定义在第轮迭代时仅节点可知的局部凸损失函数为，并定义所有节点可知的非光滑凸正则化项为，其中表示实数集； S24、基于所述非平衡网络图，将无线传感器网络中的稀疏事件检测问题建模为Bandit反馈下的分布式在线复合优化问题，该优化问题的目标是最小化所有节点在所有迭代轮次上的全局累积损失，其数学模型表述如下：，其中，为算法的总迭代次数，为传感器节点总数；所述S3具体包括以下步骤： S31、参数初始化：设定参数，，，，，其中是算法的总迭代次数，是时的迭代步长，其值是恒正的、且随着的增加呈现单调非增趋势，是时的量化参数，其值介于0到1之间、且随着的增加呈现单调非增趋势，为迭代时刻，是量化水平参数，是网络图的权重矩阵； S32、变量初始化：初始化各节点的决策变量，量化中间值向量，以及权重补偿向量，其中代表节点在初始迭代时的决策向量，代表节点在初始迭代时的量化中间值向量，代表节点在初始迭代时的权重补偿向量，代表阶单位矩阵的第列元素； S33、量化区间尺寸设定：在第轮迭代中，设定量化器的量化区间尺寸向量为，其中是用于调节量化区间尺寸的常数，表示乘法，是正则化项的梯度上界，是时的迭代步长，是时的量化参数，为迭代时刻，是元素均为1的维列向量； S34、对每一轮迭代，各节点执行算法的迭代更新过程； S35、输出所有节点的决策向量序列；在步骤S34中，所述算法迭代更新过程具体为： S34.1、决策与反馈：在第轮迭代中，节点做出决策，接收到Bandit损失反馈值，其中是探索参数，是节点从欧几里得单位球面上获取的随机向量，代表向量的欧几里得范数； S34.2、梯度估计：节点基于单点梯度估计法计算其决策处的梯度估计值，如下所示：，其中，表示节点在第轮迭代时的决策向量，表示在处的估计梯度，是向量维数，是探索参数，是节点从欧几里得单位球面上获取的随机向量，代表向量的欧几里得范数，是节点在第轮迭代时的局部凸损失函数； S34.3、量化决策：节点对其决策进行量化，得到量化决策，其中代表均匀量化函数，是节点在第轮迭代中的量化中间值向量，是第轮迭代中的量化区间尺寸向量； S34.4、一致性更新与梯度下降：节点从节点接收量化决策，并与自身的量化决策比较，结合权重矩阵和权重补偿向量执行一致性与梯度下降更新，得到中间变量，具体如下：，其中，是节点在第轮迭代中的中间变量，和分别是节点和在第轮迭代中的决策向量，是通信节点总数，是权重矩阵的第行第列元素，是节点在第轮迭代中的量化决策向量，是节点在第轮迭代中的量化决策向量，和分别是节点和在第轮迭代中的量化中间值向量，是第轮迭代中的量化区间尺寸向量，是第轮迭代中的迭代步长，是节点在第轮迭代中的权重补偿向量中的第个元素，是节点在处的梯度估计值； S34.5、近端投影更新：节点通过近端投影算子对中间变量进行投影更新，获得新一轮迭代的决策变量和量化中间值向量，具体为：，其中，和分别是节点在第轮迭代中的决策变量和量化中间值向量，是缩减参数，是正则化项，和分别是第轮迭代中的迭代步长和量化水平参数，是节点在第轮迭代中的中间变量，代表向量的欧几里得范数，表示在约束集中，使函数取得最小值时的值，其中是关于的函数； S34.6、权重补偿更新：节点基于权重矩阵更新其权重补偿向量，得到新一轮的权重补偿向量，具体如下：，其中，为节点在第轮迭代中的权重补偿向量，是通信节点总数，是权重矩阵的第行第列元素，是节点在第轮迭代中的权重补偿向量。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人中国矿业大学，其通讯地址为：221116 江苏省徐州市铜山区大学路1号中国矿业大学南湖校区；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

中国矿业大学熊梦辉获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务