同济大学乔非获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉同济大学申请的专利一种面向动态柔性作业车间的生产和物流协同调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119338156B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411255437.X,技术领域涉及:G06Q10/0631;该发明授权一种面向动态柔性作业车间的生产和物流协同调度方法是由乔非;施嘉璇;马玉敏;刘鹃;王俊凯设计研发完成,并于2024-09-09向国家知识产权局提交的专利申请。
本一种面向动态柔性作业车间的生产和物流协同调度方法在说明书摘要公布了:本发明涉及一种面向动态柔性作业车间的生产和物流协同调度方法,包括以下步骤:获取动态柔性作业车间的实时信息,输入面向动态柔性作业车间的生产和物流协同调度问题模型,采用深度强化学习方法进行求解,获得车间调度方案;其中,所述面向动态柔性作业车间的生产和物流协同调度问题模型为生产活动和物流活动设置了各自的优化目标,并考虑了物流设备的故障场景及相应的处理策略,其求解过程具体如下:S301、设计适配的多智能体嵌套分层框架;S302、设计各智能体的马尔科夫决策过程关键要素;S303、利用多智能体近端策略优化算法对各智能体进行协同训练。与现有技术相比,本发明可以获得更加合理、有效的柔性作业调度方案。
本发明授权一种面向动态柔性作业车间的生产和物流协同调度方法在权利要求书中公布了:1.一种面向动态柔性作业车间的生产和物流协同调度方法,其特征在于,包括以下步骤: 获取动态柔性作业车间的实时信息,输入面向动态柔性作业车间的生产和物流协同调度问题模型,求解获得车间调度方案; 其中,所述面向动态柔性作业车间的生产和物流协同调度问题模型的构建过程如下: S1、设置生产活动和物流活动各自的优化目标,设置任务处理和资源分配约束条件,建立面向静态柔性作业车间的生产和物流协同调度问题模型,其中,生产活动的优化目标为最小化最大完工时间,物流活动的优化目标为最小化总物流成本; S2、根据物流设备的故障场景及相应的处理策略,更新物流活动的优化目标,并进一步设置扰动下任务处理和资源分配约束条件,加入所述面向静态柔性作业车间的生产和物流协同调度问题模型中,建立面向动态柔性作业车间的生产和物流协同调度问题模型; 所述面向动态柔性作业车间的生产和物流协同调度问题模型采用深度强化学习方法进行求解,具体过程如下: S301、设计与所述面向动态柔性作业车间的生产和物流协同调度问题模型适配的多智能体嵌套分层框架,所述多智能体嵌套分层框架包括目标智能体、生产智能体和物流智能体,其中,所述生产智能体和所述物流智能体相互独立,分别用于对生产调度和物流调度进行决策,所述目标智能体用于指导所述生产智能体和所述物流智能体的决策方向; S302、根据所述多智能体嵌套分层框架中各智能体的功能和管理权限,设计奖励函数、状态特征和动作空间; S303、利用多智能体近端策略优化算法对各智能体进行协同训练,将动态柔性作业车间的实时信息输入训练好的智能体,获得车间调度方案; 步骤S301中,所述多智能体嵌套分层框架的设计具体如下: 所述目标智能体部署在所述生产智能体和所述物流智能体的上层,控制所述生产智能体和所述物流智能体; 所述生产智能体部署在所述物流智能体的上层,与所述目标智能体共同控制所述物流智能体; 步骤S302中,所述目标智能体的状态特征包括资源利用信息、任务处理信息和优化偏好,所述资源利用信息包括机器利用信息和物流设备利用信息,所述任务处理信息包括生产任务处理信息和物流任务处理信息,所述目标智能体的动作空间包括选择优化最小化最大完工时间和选择最小化总物流成本; 所述生产智能体的状态特征包括机器利用信息、生产任务处理信息、优化偏好和目标智能体决策信息,所述生产智能体的动作空间包括多个组合调度规则,用于选择未完成制造任务的最早待处理操作并将其分配给机器处理; 所述物流智能体的状态特征包括物流设备利用信息、物流任务处理信息、优化偏好和目标智能体决策信息,所述物流智能体的动作空间包括多个调度规则,用于将所选操作的衍生物流任务分配给自动导向车处理; 步骤S302中,所述奖励函数包括最小化最大完工时间目标相关奖励函数和最小化总物流成本相关奖励函数,表达式具体如下: 其中,为最小化最大完工时间目标相关奖励函数,和为权重,表示状态转移前后最小化最大完工时间变化值的归一化值,表示状态转移前后最小化最大完工时间变化值,和分别表示对最小化最大完工时间目标的优化偏好和对一个目标可能的最大偏好,和分别为状态转移前后最小化最大完工时间的变化值的最大值和最小值; 其中,为最小化总物流成本相关奖励函数,表示本次状态转移产生的物流成本的归一化值,表示本次状态转移产生的物流成本,和分别表示对最小化总物流成本目标的优化偏好和对一个目标可能的最大偏好,和分别为本次状态转移产生的物流成本最大值和最小值; 步骤S303中,利用多智能体近端策略优化算法对各智能体进行协同训练的具体过程如下: 为所述多智能体嵌套分层框架中的每个智能体随机初始化一个策略网络和一个价值网络,并为每个智能体构建一个经验回放池,所述策略网络用于根据当前状态输出选择动作,所述价值网络用于根据状态-动作对输出价值估计; 初始化单次训练所需的随机环境,在该环境下的每个决策点,采用结合噪声的-贪婪策略,根据所述多智能体嵌套分层框架的结构依次执行环境与智能体、智能体与智能体之间的交互与决策传输,积累交互轨迹至相应的经验回放池中,若经验回放池内交互轨迹数量达到固定批量大小,则基于近端策略优化算法的更新逻辑,结合随机梯度下降,利用Adam优化器更新所述策略网络和所述价值网络的参数,直至环境内制造任务全部完成; 若环境内制造任务全部完成后未达到最大训练次数,则重新初始化单次训练所需的随机环境,重复前述训练过程,更新网络参数,直至达到最大训练次数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同济大学,其通讯地址为:200092 上海市杨浦区四平路1239号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励