Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京大学刘畅获国家专利权

北京大学刘畅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京大学申请的专利基于自适应粒子滤波树的机器人动态目标搜索和追踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118897541B

龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410547681.7,技术领域涉及:G05D1/43;该发明授权基于自适应粒子滤波树的机器人动态目标搜索和追踪方法是由刘畅;周康杰;武鹏荧;高涵;马骥设计研发完成,并于2024-05-06向国家知识产权局提交的专利申请。

基于自适应粒子滤波树的机器人动态目标搜索和追踪方法在说明书摘要公布了:本发明公开了基于自适应粒子滤波树的机器人动态目标搜索和追踪方法,该方法基于sigma点的互信息估计方法,能够快速准确地计算互信息。在蒙特卡洛树搜中利用符合运动学模型的运动基元组成动作空间,用以生成满足运动学约束的平滑路径。所采用的自适应粒子滤波树中自适应的停止策略,能够根据奖励信息动态调整规划时域,减少运算时间。本发明对未来可行路径进行有选择地搜索,同时其自适应的性质能够根据当前奖励信息动态调整规划时域,节省计算资源。结合以运动基元构成的动作空间,该发明可以高效地生成考虑未来观测影响的、长时域的、符合运动学模型的平滑路径,从而高效地完成目标搜索和追踪的问题。

本发明授权基于自适应粒子滤波树的机器人动态目标搜索和追踪方法在权利要求书中公布了:1.基于自适应粒子滤波树的机器人动态目标搜索和追踪方法,其特征在于,包括以下步骤: 步骤1:移动机器人在当前所在位置利用有限视野的传感器,包括相机、雷达,获取周围环境信息;定义移动机器人通过多种传感器对目标的观测结果为z;如果目标在移动机器人的观测范围之内,移动机器人获得目标的观测信息,即目标相对于机器人的距离和角度信息;否则,移动机器人对目标的观测结果为空;移动机器人使用粒子滤波技术对观测结果z进行滤波,得到目标位置的估计结果; 步骤2:根据当前基于粒子的目标位置估计结果和移动机器人自身状态,基于蒙特卡洛树搜方法进行建树,迭代地进行选择-扩展-模拟-回溯四个步骤,增量式地建立自适应粒子滤波树,不断在自适应粒子滤波树中添加节点并维护更新节点的信息,用于后续的移动机器人决策;自适应粒子滤波树中的节点用于存储移动机器人在规划时域的信息,包括预测移动机器人在规划时域内可能到达的位置及对应的奖励,自适应粒子滤波树是用来是探索移动机器人未来可能的轨迹,为移动机器人提供最优的运动决策方案;自适应粒子滤波树包含两种类型的节点:动作节点和状态节点,两种节点根据动作-观测序列交替生成,来模拟规划移动机器人在规划时域的移动过程中采取的动作和可能获得的观测结果; 步骤3:基于建立好的自适应粒子滤波树,移动机器人选择树根节点中奖励最大的子节点,即移动机器人当前所在位置的最优决策;随后,移动机器人执行该奖励最大的子节点对应的运动控制,生成运动轨迹; 步骤4:在移动机器人执行完运动轨迹到达新的位置后,重复步骤1-3,即移动机器人根据新获得的观测结果进行重规划,直至完成目标搜索和追踪的任务;在移动机器人运动的过程中,环境中的目标对象是动态的,由此,移动机器人不断获取新的环境和目标信息,对目标位置进行估计,并进行轨迹规划来实现对动态目标的实时搜索和追踪,保证对目标定位的准确性; 建树过程包括选择-扩展-模拟-回溯四个步骤: 步骤2.1,选择:基于当前策略树信息,移动机器人根据UCB准则,权衡动作探索和利用,选择当前树中最有价值的规划路径,即一系列动作-状态节点;UCB准则用于选取节点n中最优的子节点n*,具体选择公式如下: 其中Q为节点的累积奖励,Nn为节点n被访问过的次数,Nn'为节点n'被访问过的次数,C为节点n的子节点组成的集合,c为权衡探索和利用的参数;从根节点开始,移动机器人不断通过该准则选择最优的子节点,找到当前最优的规划路径;根据选择的一系列动作-状态节点,使用其动作-观测序列和粒子滤波技术对粒子估计结果进行预测和更新; 步骤2.2,扩展:移动机器人在找到所选择规划路径的终点后,在终点所对应状态节点的动作集合和环境信息中采样得到动作-观测序列,使用基于sigma点的互信息估计方法计算带来的奖励,并利用粒子滤波对粒子估计结果进行更新,扩展出新的动作节点和状态节点; 步骤2.3,模拟:对于扩展过程中新扩展的状态节点,进行自适应rollout过程,即根据提前设定的动作策略对新扩展节点的移动机器人进行动作模拟,计算该过程的累计折扣奖励,直到到达终止状态或者预设的时间预算,用于估计该新节点的价值;如果在达到终止状态或者预设的时间预算前,获取的信息收益大于提前设定的阈值,则提前终止rollout过程,用于自适应调整规划时域; 步骤2.4,回溯:根据模拟步骤中自适应rollout过程得到的奖励信息对所有访问过的动作节点进行回溯,更新节点访问次数和奖励信息;具体过程为把新扩展的节点作为当前节点n',找到其父节点n,对父节点n进行更新,公式如下: Nn=Nn+1 其中r是即时奖励,V是规划时域内的总折扣奖励,γ是折扣因子;更新完节点n的信息后,选择其父节点作为当前节点并迭代地进行上述步骤,直到回溯到根节点;通过不断重复选择-扩展-模拟-回溯四个步骤,迭代式地建立更新策略树,用于移动机器人最优策略的选取。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100080 北京市海淀区颐和园路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。