Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 清华大学孙富春获国家专利权

清华大学孙富春获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉清华大学申请的专利机器人异构操作技能的迁移学习方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115630685B

龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211227789.5,技术领域涉及:G06N3/0464;该发明授权机器人异构操作技能的迁移学习方法、装置及存储介质是由孙富春;刘乃军设计研发完成,并于2022-10-09向国家知识产权局提交的专利申请。

机器人异构操作技能的迁移学习方法、装置及存储介质在说明书摘要公布了:本公开实施例提供的机器人异构操作技能的迁移学习方法、装置及存储介质,包括:设置机器人异构操作技能迁移学习的预训练任务,基于强化学习方法实现源域中机器人和目标域中机器人对预训练任务的技能策略学习;分别构建源域机器人和目标域机器人的自编码器,采用对比学习方法并融合域随机化方法分别对两类自编码器进行训练;利用两类自编码器构建迁移奖励函数,基于强化学习方法,通过最大化目标3C装配任务奖励函数与迁移奖励函数和的方式,将源域机器人在目标3C装配任务上的技能策略迁移到目标域机器人。本公开可满足对3C装配机器人异构操作技能快速更新学习的要求,可提升3C装配的生产效率和智能化水平,降低3C装配产业的生产制造成本。

本发明授权机器人异构操作技能的迁移学习方法、装置及存储介质在权利要求书中公布了:1.一种机器人异构操作技能的迁移学习方法,其特征在于,包括: 设置面向3C装配的机器人异构操作技能迁移学习的预训练任务,基于强化学习方法实现源域中机器人和目标域中机器人对相同预训练任务的技能策略学习,分别得到源域机器人预训练任务技能策略和目标域机器人预训练任务技能策略; 在预训练任务操作环境中,分别执行所述源域机器人预训练任务技能策略和所述目标域机器人预训练任务技能策略,并记录源域机器人状态和目标域机器人状态,得到交互训练数据; 构建源域机器人自编码器和目标域机器人自编码器,各机器人的自编码器均分别包含编码器和解码器,基于所述交互训练数据采用对比学习方法并融合域随机化方法同时对所述源域机器人自编码器和所述目标域机器人自编码器进行训练,得到训练完毕的源域编码器和目标域编码器,以分别将所述源域机器人状态和所述目标域机器人状态映射到共同特征域空间;其中,源域状态sS经源域机器人自编码器的源域编码器f映射后得到源域隐空间状态特征fsS,目标域状态sT经目标域机器人自编码器的目标域编码器g映射后得到目标域隐空间状态特征gsT,通过最小化||fsS-gsT||2的学习方式使fsS与gsT映射到共同特征域空间;采用域随机化方法,通过从高斯分布N中采集噪声数据σS、σT分别加到源域编码器f对应的输入源域状态sS与目标域编码器g对应的输入目标域状态sT以增广输入状态的分布; 构建源域机器人技能策略神经网络和目标域机器人技能策略神经网络,基于执行目标3C装配任务的示教数据和行为克隆的模仿学习方法对所述源域机器人技能策略神经网络进行训练,得到源域机器人在目标3C装配任务上的技能策略,利用所述训练完毕的源域编码器和目标域编码器构建迁移奖励函数,基于强化学习方法,通过最大化目标3C装配任务奖励函数与所述迁移奖励函数的和的方式对所述目标域机器人技能策略神经网络进行训练,将所述源域机器人在目标3C装配任务上的技能策略迁移到目标域机器人上。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区清华园1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。