Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川大学赵涛获国家专利权

四川大学赵涛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川大学申请的专利基于知识引导的无地图导航模型实现的导航方法、装置、机器人及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119779312B

龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510028410.5,技术领域涉及:G01C21/20;该发明授权基于知识引导的无地图导航模型实现的导航方法、装置、机器人及存储介质是由赵涛;秦鹏设计研发完成,并于2025-01-08向国家知识产权局提交的专利申请。

基于知识引导的无地图导航模型实现的导航方法、装置、机器人及存储介质在说明书摘要公布了:本发明提供了一种基于知识引导的无地图导航模型实现的导航方法、装置、机器人及存储介质,该无地图导航模型是基于知识系统中的多条行动规则,对预先构建的DDPG算法模型进行训练得到的,相较于单一采用DDPG算法导航泛化性更强。在训练过程中,将引导动作指令与策略动作指令进行融合可以降低DDPG算法模型对动作选择的随机性,从而能够快速获取有价值的数据,提高学习效率,并且在奖励稀疏的环境,移动机器人可以在知识的引导下与环境交互,而不是随机的交互,避免陷入到局部最优,保证了在奖励稀疏环境中易收敛;以及将策略动作指令以及融合得到的综合动作指令均输入预设损失函数,降低了单一采用DDPG算法时对应损失函数的不确定性,从而使学习过程更稳定。

本发明授权基于知识引导的无地图导航模型实现的导航方法、装置、机器人及存储介质在权利要求书中公布了:1.一种基于知识引导的无地图导航模型实现的导航方法,其特征在于,包括: 获取移动机器人在当前时刻的环境状态数据、当前位置与目标点之间的相对位置数据以及上一时刻的动作指令; 将所述当前时刻的环境状态数据和相对位置数据以及所述上一时刻的动作指令转换为当前状态向量; 将所述当前状态向量输入训练后的无地图导航模型,得到所述当前时刻的动作指令;所述无地图导航模型是基于预设的知识系统中的多条行动规则,对预先构建的深度确定性策略梯度算法模型进行训练得到的; 利用所述当前时刻的动作指令,控制所述移动机器人向所述目标点前进; 其中,所述无地图导航模型是通过以下方式训练得到的: 基于所述知识系统、所述深度确定性策略梯度算法模型和泛化器,控制智能体与预设的虚拟环境持续进行交互,并将交互产生的每条交互数据加入初始为空的经验数据库; 当所述经验数据库中交互数据的数量达到时,从所述经验数据库随机采样出条交互数据;为正整数; 基于所述条交互数据和所述知识系统中的多条行动规则,对所述深度确定性策略梯度算法模型和所述泛化器进行参数更新; 基于所述知识系统、更新后的深度确定性策略梯度算法模型和更新后的泛化器,控制所述智能体与所述虚拟环境持续进行交互,并将交互产生的每条交互数据加入所述经验数据库; 判断所述智能体与所述虚拟环境之间的交互回合数是否达到预设值; 若否,则返回所述从所述经验数据库采样出条交互数据的步骤,直至所述智能体与所述虚拟环境之间的交互回合数达到所述预设值; 若是,则控制所述智能体停止与所述虚拟环境进行交互,并将当前的深度确定性策略梯度算法模型作为所述无地图导航模型; 其中,所述基于所述条交互数据和所述知识系统中的多条行动规则,对所述深度确定性策略梯度算法模型和所述泛化器进行参数更新的步骤,包括: 针对第条交互数据,从所述第条交互数据中获取状态向量,并将所述状态向量与所述知识系统中的多条行动规则进行匹配,以获得引导动作指令;其中,; 将所述状态向量输入所述深度确定性策略梯度算法模型,得到策略动作指令和状态价值; 将所述引导动作指令和所述策略动作指令输入所述泛化器进行融合,得到综合动作指令; 将所述泛化器当前的融合参数、所述状态价值、所述策略动作指令以及所述综合动作指令输入预设损失函数,得到所述第条交互数据对应的综合损失; 基于条交互数据对应的综合损失计算期望损失,并基于所述期望损失对所述深度确定性策略梯度算法模型的模型参数和所述泛化器的融合参数进行更新; 其中,所述引导动作指令包括引导线速度和引导角速度;所述知识系统的多条行动规则包括至少一条精确行动规则、至少一条模糊行动规则和至少一条混合行动规则,每条所述行动规则存在关联的位置数据;所述精确行动规则包括至少一个精确条件和结论数据,所述模糊行动规则包括至少一个模糊条件和结论数据,所述混合行动规则包括至少一个精确条件、至少一个混合条件以及结论数据;所述结论数据包括预设线速度和预设角速度; 所述将所述状态向量与所述知识系统中的多条行动规则进行匹配,以获得引导动作指令的步骤,包括: 针对每条所述精确行动规则,基于所述精确行动规则关联的位置数据从所述状态向量中获取至少一个向量值;若所述至少一个向量值使得所述精确行动规则的每个精确条件成立,则将所述精确行动规则中的预设线速度和预设角速度分别作为目标线速度和目标角速度; 针对每条所述模糊行动规则,基于所述模糊行动规则关联的位置数据从所述状态向量中获取至少一个向量值;计算所述至少一个向量值相对于所述模糊行动规则的每个模糊条件关联的模糊集之间的隶属度,并将得到的各个隶属度相乘得到激活强度,将得到的激活强度分别与所述模糊行动规则中的预设线速度和预设角速度相乘,得到目标线速度和目标角速度; 针对每条所述混合行动规则,基于所述混合行动规则关联的位置数据从所述状态向量中获取至少一个向量值;若所述至少一个向量值使得所述混合行动规则的每个精确条件成立,则计算所述至少一个向量值相对于所述混合行动规则的每个模糊条件关联的模糊集之间的隶属度,并将得到的各个隶属度相乘得到激活强度,将得到的激活强度分别与所述混合行动规则中的预设线速度和预设角速度相乘,得到目标线速度和目标角速度; 将全部所述目标线速度相加得到所述引导线速度,将全部所述目标角速度相交得到所述引导角速度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。