科大智能物联技术股份有限公司;合肥工业大学钟智敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大智能物联技术股份有限公司;合肥工业大学申请的专利一种用于非字型货架的立体仓库货位分配优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115860239B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211594440.5,技术领域涉及:G06Q10/04;该发明授权一种用于非字型货架的立体仓库货位分配优化方法是由钟智敏;王灵均;谭琦;程八一;刘伟;王筱圃;张弢设计研发完成,并于2022-12-13向国家知识产权局提交的专利申请。
本一种用于非字型货架的立体仓库货位分配优化方法在说明书摘要公布了:本发明公开了一种用于非字型货架的立体仓库货位分配优化方法,包括构建基于DQN框架的强化学习模型,并定义强化学习模型中的智能体、状态空间、动作空间、奖励回报,以及其优化目标;对强化学习模型的所有参数值和策略进行初始化,并批量生成出入库任务,通过泊松到达的出入库任务训练强化学习模型;利用反向传播算法对策略梯度进行求导,计算梯度下降更新DQN网络参数,得到训练完成的强化学习模型,并应用于立体仓库进行货位智能优化。本发明通过货物出入库任务训练模型取得最优分配方案,解决了动态存储、大规模物流场景的非字型货架仓库的货位分配问题。
本发明授权一种用于非字型货架的立体仓库货位分配优化方法在权利要求书中公布了:1.一种用于非字型货架的立体仓库货位分配优化方法,其特征在于,具体步骤包括: 步骤S1、构建基于DQN框架的强化学习模型,并定义强化学习模型中的智能体、状态空间、动作空间、奖励回报,以及其优化目标; 步骤S2、对强化学习模型的所有参数值和出入库策略进行初始化,并随机生成出入库任务; 步骤S3、将基于泊松到达过程的所述出入库任务输入强化学习模型,对构建的强化学习模型进行训练; 步骤S4、利用反向传播算法对策略梯度进行求导,计算梯度下降更新DQN网络参数,其具体步骤包括: S41、优先经验抽取: 首先从经验池中采样一个批量数据,通过概率方式进行抽取经验,则每个经验的实际抽取概率为: 其中,pj=|δt+∈|,j为经验池中的经验的个数,δt为TD偏差,设定非均匀抽样概率pj正比于TD偏差δt,对pj的进行归一化处理得到每个经验的实际抽样概率Pj; 通过相应调整学习率α,消除偏差,表达式为: α←α·npt-β 其中,n为参与抽样的经验数,β∈0,1]; S42、价值网络更新: 引入一个目标网络,从目标网络估计TD目标值,用于进行DQN网络的更新,通过使用新的DQN网络更新目标网络,根据采样的经验st,a,rt,st+1来更新DQN网络,具体公式如下: TD目标值: TD偏差:δt=Qst,at;w-yt 梯度下降: 其中,st表示t时刻的状态,a表示动作选择,at表示t时刻的动作选择,Qst,at;w表示目标网络对当前t时刻的状态动作选择的价值估计,rt是t时刻当前动作选择得到的立即回报,γ∈0,1]代表对未来状态价值估计的衰减,st+1表示下一状态,表示t+1时刻的最大状态动作选择的价值估计,α代表算法更新的学习率,w表示梯度下降; 步骤S5、重复上述步骤S3和S4,得到训练完成的强化学习模型,并应用于立体仓库进行货位智能优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大智能物联技术股份有限公司;合肥工业大学,其通讯地址为:230031 安徽省合肥市中国(安徽)自由贸易试验区合肥市高新区望江西路900号中安创谷科技园一期A1楼6、7层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。