兰州理工大学赵付青获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉兰州理工大学申请的专利一种基于强化学习的分布式阻塞流水车间调度优化系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116700176B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310725678.5,技术领域涉及:G05B19/418;该发明授权一种基于强化学习的分布式阻塞流水车间调度优化系统是由赵付青;周刚;张建林;朱宁宁;许天鹏;宋厚彬;姚毓凯设计研发完成,并于2023-06-19向国家知识产权局提交的专利申请。
本一种基于强化学习的分布式阻塞流水车间调度优化系统在说明书摘要公布了:本发明属于制造业分布式生产调度领域,具体涉及一种基于强化学习的分布式阻塞流水车间调度优化系统,包括调度序列多样化初始化模块、基于Q‑learning的改进模块和基于邻域重构的局部搜索模块;所述调度序列多样化初始化模块设计了一种多样化初始种群生成策略,所述基于Q‑learning的改进模块设计了一种基于强化学习机制的全局搜索机制,根据搜索状态和算子的历史经验自适应选择搜索算子。所述基于邻域重构的局部搜索模块包括基于邻域重构的深度局部搜索策略和基于路径重连的改进策略。本发明逻辑简单、易于实现和易于扩展,可以将优化器扩展到满足当前智能制造生产领域中的大多数调度问题中。
本发明授权一种基于强化学习的分布式阻塞流水车间调度优化系统在权利要求书中公布了:1.一种基于强化学习的分布式阻塞流水车间调度优化系统,其特征在于:包括调度序列多样化初始化模块、基于Q-learning的改进模块和基于邻域重构的局部搜索模块; 所述调度序列多样化初始化模块设计了一种多样化初始种群生成策略,首先,随机生成一个初始化序列以保证初始序列的多样性;然后,前f个工件被依次取出,放置在各个工厂的第一个位置,剩下的工件被按序依次取出,尝试插入到所有工厂中最好的位置,重复上述过程,直至生成一定数量的个体,组成种群;具体的,首先,确定每个工厂的第一个加工工件,随机排序后的前f个工件依次插入每个工厂的第一个位置;其次,为每个工厂选择要在最后一台机器上处理的工件,根据最后一台机器上工件的加工处理时间,所有剩余工件按升序排列,排序后的前f个工件插入每个工厂的最后一个位置;每个工厂执行基于NEH启发式的插入操作,除每个工厂的第一个和最后一个工件外,所有剩余工件执行基于NEH的邻域插入搜索,使系统在求解分布式阻塞流水车间调度问题时能够获得更高精度的结果; 所述基于Q-learning的改进模块设计了一种基于强化学习机制的全局搜索机制,根据搜索状态和算子的历史经验自适应选择搜索算子;设计了五种具有邻域知识的基于邻域扰动的策略集,策略集中的邻域扰动算子有两种类型,第一种是基于关键工厂Cfac内部的操作,另一种是关键工厂与其他工厂之间的操作;Q-learning算法在Refset更新过程中的每一步选择最合适的扰动策;动作集A=N1,N2,…,N5被定义为具有五种不同扰动强度的邻域搜索算子;为了优化工件序列,采用了5种序列相关的操作;n表示工件数量,m表示机器数量;Randfac是一个随机工厂,Cfac是关键工厂; 具体操作过程描述如下: N1Insert_Randfac_Cfac:在Cfac和随机选择的工厂Randfac之间执行插入操作;首先,随机选择一个非关键工厂,然后,依次取出Cfac中每个工件重新插入到Randfac中的所有位置,记录产生最佳Cmax的位置; Swap_Randfac_Cfac:在Cfac和随机选择的工厂Randfac之间执行交换操作;首先,随机选择一个非关键工厂,然后,依次取出Cfac中每个工件与Randfac中每个位置的工件交换,记录产生最佳Cmax的位置; Insert_Cfac:在Cfac中随机选择一个工件,并将其插入该工厂的所有可能位置,如果插入后Cfac的Cmax优于当前解,则保留新解; Swap_Cfac:在Cfac中随机选择两个工件,然后交换,如果在交换后Cmax得到改进,则接受新解; Insert_block_Cfac:首先,在Cfac中随机选择一个起始位置,提取由ηη=rand[2,4]个连续工件组成的工件块并从原始位置移除,然后将该工件块重新插入Cfac的最佳位置; 采用了改进的ε-greedy策略,在种群迭代进化的早期阶段,以更高的概率探索新的行为,随着训练时间的增加,智能体从探索新的动作转向选择目前能获得最大回报的动作,采用这种策略的好处是确保智能体能够探索更广的搜索区域,同时保留一定的深度探索能力;改进后的策略具体表述如下: 其中a表示在s状态下Q值最大的动作,As表示s状态中所有可选动作的集合,Prand是服从标准正态分布的样本值,Tmax表示停止标准,Tmax=10×n×m×f; 所述基于邻域重构的局部搜索模块是一种基于路径重连的深度局部搜索策略,路径重连策略是探索两个给定解的邻域的一种有效搜索方法,在该阶段被应用以生成一个新的有价值的解;首先,选择当前最好的个体Cbest与当前个体Ci进行比较;对当前个体Ci执行插入或交换转换为Cbest,并在每次执行运算操作后产生一个中间个体;最后,对所有中间个体进行评估,并保留最优个体。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人兰州理工大学,其通讯地址为:730050 甘肃省兰州市七里河区兰工坪路287号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励