浙江大学张诗笛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于强化学习的机械臂动态物体抓取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116945180B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310991331.5,技术领域涉及:B25J9/16;该发明授权一种基于强化学习的机械臂动态物体抓取方法是由张诗笛;毕运波设计研发完成,并于2023-08-08向国家知识产权局提交的专利申请。
本一种基于强化学习的机械臂动态物体抓取方法在说明书摘要公布了:本发明公开了一种基于强化学习的机械臂动态物体抓取方法。本发明包括:分解长周期复杂任务,设计了难度依次递增的五个阶段训练任务;通过执行各个阶段训练任务,获得机械臂动态物体抓取智能模型,实现机械臂对动态物体的有效抓取。本发明针对实际工业环境,结合长周期复杂任务的需要,提出了有效的状态表示和奖励函数设计,实现了更快的收敛速度和更高的训练效率。此外,本发明对机器人运动进行了动力学优化,确保了机器人运动过程中的稳定性和精确性。
本发明授权一种基于强化学习的机械臂动态物体抓取方法在权利要求书中公布了:1.一种基于强化学习的机械臂动态物体抓取方法,其特征在于,包括以下步骤: S1:构建多阶段训练任务; S2:根据多阶段训练任务依次训练强化学习网络模型,直至训练完成,获得机械臂动态物体抓取智能模型; S3:将目标任务输入到机械臂动态物体抓取智能模型中,实现机械臂对目标物体的抓取; 所述强化学习网络模型在各阶段训练过程中,各阶段的奖励函数均包括基础奖励,公式分别为: R1=R2=rbase R4=rbase′ R5=rbase″ 其中,R1、R2、R3、R4和R5分别为第一阶段-第五阶段的奖励函数值,rbase为第一基础奖励值,j为对应的关节角标号,为关节角度限制奖励,为平滑控制奖励,θj表示机器人的关节角,θj_limit表示机器人的关节角限制范围,θ″j表示机器人的关节角加速度,jmax表示关节角标号的最大值,rbase′为第二基础奖励值,rbase″为第三基础奖励值,和ω分别为第一调整系数和第二调整系数; 所述基础奖励的公式如下: rbase=rreach+rlift+rt rreach=rdog+rgo rlift=rgc+rcog+rzo 其中,rbase为第一基础奖励值,rreach为接近过程的奖励值,rlift为提升过程的奖励值,rt为时间奖励值,rdog为距离奖励值,rgo为夹爪张开的奖励,rgc是夹爪闭合的奖励值,rcog是夹爪两指与物体的接触奖励值,rzo是目标物体提升奖励值,zo为物体的实时高度,zo_initial为场景初始化时物体的高度,tl为第一时间限制,β、γ、δ、ε分别为第四调整系数-第七调整系数; 所述第二基础奖励值rbase′是将基础奖励中的第一时间限制tl替换为第二时间限制tl4后计算获得的,其中tl4满足tl4=∈*tl,∈为第八调整系数; 所述第三基础奖励值rbase″是将基础奖励中的第一时间限制tl替换为第三时间限制tl5后计算获得的,其中tl5满足tl5=μ*tl,μ为第九调整系数,且∈μ。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励