杭州涛谱科技有限公司蔡建湖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州涛谱科技有限公司申请的专利一种基于虚拟工厂机器人的FSM仿真方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119781315B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510028092.2,技术领域涉及:G05B17/02;该发明授权一种基于虚拟工厂机器人的FSM仿真方法及系统是由蔡建湖;黄涛;刘玉琴设计研发完成,并于2025-01-08向国家知识产权局提交的专利申请。
本一种基于虚拟工厂机器人的FSM仿真方法及系统在说明书摘要公布了:本发明公开了一种基于虚拟工厂机器人的FSM仿真方法及系统,具体涉及FSM仿真技术领域,包括在FSM仿真中使用Q‑Learning算法优化机器人的决策过程,并在机器人的决策过程中提取机器人的当前任务和未来任务,对机器人不同未来任务的历史奖励值进行分析,对未来任务的历史奖励值进行指数加权移动平均分析和概率密度分析,确定未来任务的不确定性信息,并通过对比分析获得未来任务的依赖信息,将未来任务的不确定性信息和依赖信息进行综合性分析,对Q‑Learning算法的折扣因子动态调整,选择性使用更新折扣因子,本发明通过FSM仿真,帮助机器人在复杂且动态的工厂环境中更高效地完成任务,从而实现智能化的生产管理。
本发明授权一种基于虚拟工厂机器人的FSM仿真方法及系统在权利要求书中公布了:1.一种基于虚拟工厂机器人的FSM仿真方法,其特征在于,具体包括以下步骤: S1:在FSM仿真中使用Q-Learning算法优化机器人的决策过程,并在机器人的决策过程中提取机器人的当前任务和未来任务; S2:对机器人不同未来任务的历史奖励值进行分析,对未来任务的历史奖励值进行指数加权移动平均分析和概率密度分析,确定未来任务的不确定性信息,并通过对比分析获得未来任务的依赖信息; S3:将未来任务的不确定性信息和依赖信息进行综合性分析,对Q-Learning算法的折扣因子动态调整,确定更新折扣因子和基础折扣因子; S4:结合机器人在使用更新折扣因子与基础折扣因子下的工作表现,分析差异信息和效率信息,选择性使用更新折扣因子; 其中,将不确定信息通过奖励波动幅度系数和概率分布胁迫系数表示; 所述奖励波动幅度系数的获取逻辑为:提取机器人的未来任务,采集机器人在未来任务的历史数据,使用指数加权移动平均平滑未来任务的奖励波动性,指数加权移动平均的表达式为:;其中,表示当前时刻的平滑值,表示平滑因子,表示上一个时刻的平滑值,表示未来任务的即时奖励值; 根据未来任务的历史数据,获得未来任务每次任务的平滑值,计算未来任务每次任务的平滑值与实际奖励值之间的差异,将未来任务每次任务的平滑值与实际奖励值之间的差异标记为:,其中,,为未来任务每次任务的平滑值,为未来任务每次任务的实际奖励值,n=1、2、3、……、N,N为正整数,n为未来任务历史数据的编号; 计算奖励波动幅度系数,计算公式为:;其中,为奖励波动幅度系数; 所述概率分布胁迫系数的获取逻辑为:根据采集机器人在未来任务的历史数据,使用高斯函数表示未来任务奖励值的概率密度函数,表达式为: ;其中,为未来任务奖励值的标准差,为未来任务奖励值的平均值,,; 计算概率分布胁迫系数,计算公式为:;其中,为未来任务在历史数据中奖励值的最小值,为未来任务在历史数据中奖励值的最大值; 将未来任务的依赖信息通过优先影响系数表示; 所述优先影响系数的获取逻辑为:根据机器人未来任务的历史数据,确定机器人完成当前任务后选择未来任务后的平均奖励值,并将机器人完成当前任务后选择未来任务后的平均奖励值标记为:,其中,i=1、2、3、……、I,I为正整数,i为未来任务的编号; 获得机器人完成当前任务后选择未来任务后奖励值的最大值和最小值,并将机器人完成当前任务后选择未来任务后奖励值的最大值和最小值分别标记为:和;计算优先影响系数,计算公式为:;其中,为优先影响系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州涛谱科技有限公司,其通讯地址为:311100 浙江省杭州市余杭区仓前街道良睦路1399号2幢312室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。