吉林大学刘国红获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉吉林大学申请的专利一种基于异步联邦学习和DDQN的表面材质分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116630775B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310597443.2,技术领域涉及:G06V10/82;该发明授权一种基于异步联邦学习和DDQN的表面材质分类方法是由刘国红;王浩明;杨丽晶;张利平;何金其设计研发完成,并于2023-05-25向国家知识产权局提交的专利申请。
本一种基于异步联邦学习和DDQN的表面材质分类方法在说明书摘要公布了:本发明适用于遥操作领域,提供了一种基于异步联邦学习和DDQN的表面材质分类方法,建立全局DDQN模型并初始化模型参数,并行地开启客户端调度和模型参数聚合进程,随机选择客户端触发训练并发送全局模型参数和通信轮次,对视触数据处理,构建DDQN环境,计算时间差分误差,更新模型参数,将参数传递到服务端,服务端利用聚合算法进行全局参数更新,再次选择进行训练的客户端,完成通信,并对复杂场景设计调度聚合算法。本发明在本地数据的大小和多样性方面均存在较大差异的情况下,也能让每个用户也都能训练出代表整个数据源的DDQN模型;用服务端和客户端通信时仅传输模型参数,不仅显著减少了通信数据量,而且保证了每个客户端的数据安全。
本发明授权一种基于异步联邦学习和DDQN的表面材质分类方法在权利要求书中公布了:1.一种基于异步联邦学习和DDQN的表面材质分类方法,其特征在于,包括以下步骤: 步骤一、服务端建立全局DDQN模型并初始化模型参数,并行地开启客户端调度和模 型参数聚合进程; 步骤二、服务端在客户端调度进程中随机选择部分客户端触发训练,并发送全局模型 参数和通信轮次到客户端; 步骤三、客户端利用ResNet50对视触数据处理,构建DDQN环境,设置状态、动作和奖励函数; 步骤四、计算时间差分误差,通过随机梯度下降更新模型参数;客户端通过随机梯度下降更新参数的具体途径是: 客户端根据接收模型参数,进行次客户端本地梯度下降,即; 则目标网络与评估网络分别为; 计算一个时间差TD目标: 利用TD目标信息,评价网络建立损失函数: 其中从经验池中随机抽取,利用这个损失函数,更新评价网络的参数: 其中,为学习率; 至此完成模型的一次随机梯度下降更新,在经历次梯度下降后,同步网络参数到目标 网络 步骤五、客户端经过次参数更新,将参数传递到服务端,服务端在参数聚合进程中 利用聚合算法进行全局参数更新; 步骤六、服务端再次选择进行训练的客户端,完成一次通信,并对通信不畅,数据分布不均匀的复杂场景设计调度聚合算法;服务端再次选择客户端的具体途径是: 参数聚合后服务器获取新的全局参数,检测队列中的数量,当二元组的 数量少于特定常值时,服务器再次根据调度算法进行调度,将全局模型参数传递到客户 端,触发相应客户端进行训练,采取新的调度算法: 其中,为客户端被选取概率,在个别客户端通信不畅的情况下,调整该客户端在参 数聚合中的权重; 采取新聚合算法,应对客户端本地数据分配不均匀: 新聚合算法以拥有材质样本数量最多的客户端为基准,各客户端拥有材质种类数量比 上基准客户端材质种类数量定义为该客户端不均匀率,对进行映射,得到聚合权重系 数: 则有新的参数聚合公式: 当本地数据分布不均匀时,采用上述参数聚合公式,在多次通信后,得到了对表面材质实现分类的健壮的分类器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉林大学,其通讯地址为:130012 吉林省长春市前进大街2699号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励