Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中山大学王甲海获国家专利权

中山大学王甲海获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中山大学申请的专利一种基于深度强化学习的城市电动车辆调度方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114418213B

龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210056967.6,技术领域涉及:G06Q10/047;该发明授权一种基于深度强化学习的城市电动车辆调度方法和系统是由王甲海;黄欢欢设计研发完成,并于2022-01-18向国家知识产权局提交的专利申请。

一种基于深度强化学习的城市电动车辆调度方法和系统在说明书摘要公布了:本发明公开了一种基于深度强化学习的城市电动车辆调度方法和系统,方法为一种端到端的方法,给定问题实例作为输入,利用训练好的深度神经网络可以直接输出问题的解。具体地,提出了一个可以捕捉和提取边信息的图神经网络对策略进行建模,以有效地解决非对称车辆路径问题,且提出了一个软约束+硬约束的两阶段训练方法,以有效地处理带时间窗电动车辆路径问题中的复杂约束。与传统方法相比,它能在获得更好求解效果的前提下大幅度地缩减求解时间。

本发明授权一种基于深度强化学习的城市电动车辆调度方法和系统在权利要求书中公布了:1.一种基于深度强化学习的城市电动车辆调度方法,其特征在于,包括以下步骤: S1:将带时间窗电动车辆路径问题建模成一个有向完全图,仓库、充电站和客户为图中的结点,任意两个结点之间通过边相连接,对需求、距离和时间数据分别进行归一化处理; S2:使用编码器分别对所述有向完全图中的点信息和边信息进行编码得到对应的特征表示; S3:使用解码器进行解码,在每步解码中根据步骤S2中得到的点和边的特征表示以及当前车辆状态信息和历史路径信息,以自回归的方式逐步构造路径,得到问题的解; S4:根据所述问题的解计算出总回报,使用REINFORCE算法对编码器和解码器的参数进行更新; S5:将训练好的编码器和解码器用于求解带时间窗电动车辆路径问题; 所述步骤S1中结点信息为vi=di,ei,li,ti,其中,di表示客户需求,ei表示最早服务时间,li表示最晚服务时间,ti表示结点类型,且有: 其中,Vd,Vs,Vc分别表示仓库结点集合、充电站结点集合和客户结点集合; 所述步骤S1中边信息为eij=disij,timeij,aij,其中,disij表示距离,timeij表示时间,aij表示最近邻,且有: 所述步骤S2具体包括以下步骤: S2.1:使用两个嵌入层分别将所述结点信息vi和边信息eij映射成高维的特征向量,得到图神经网络的第一层输入和 式中,WV,bV,WE,bE均为可训练的参数; S2.2:使用图神经网络,将和经过N层图神经网络得到最终的特征向量表示,在图神经网络的每一层中,每一点和边都会聚集相邻点和边的信息以更新自身,其中点特征表示的更新方式为: 边特征表示的更新方式为: 其中MHA是多头注意力子层,FF是全连接子层,BN是批正则化子层,[;]表示拼接操作,σ是激活函数Relu,均为可训练的参数,最后一层图神经网络的输出即为所有点信息和边信息经过编码器编码得到的特征向量表示; 所述步骤S3具体包括以下步骤: S3.1:根据编码器编码得到的点和边的特征向量表示以及当前解码步的车辆状态信息和历史路径信息,先使用glimpse机制计算出一个查询向量,具体地,假设车辆当前在i结点,则计算出查询向量: ct=WCCt+bC ht=GRUthi 式中,MHA表示多头注意力层,WC,bC均为可训练的参数,Ct=Tt,Dt,Bt表示当前车辆状态信息,Tt是当前时间,Dt是剩余容量,Bt是剩余行驶里程,hj和表示对应点和边的特征向量表示; S3.2:采取注意力机制,根据查询向量qt及与结点i相邻点和边的隐向量计算出每一结点的权重,即概率分布pt: pt=softmaxut 其中WQ,WK为可训练的参数,C为常数,dh为Qt的维度,表示在t步解码时结点j可以被选择,反之则表示不能被选择,在软约束处理方法中,当遇到如下情况之一时有 ●i=j; ●结点i为仓库或充电站且结点j为充电站; ●结点j为客户且已经被访问过; 在硬约束处理方法中,当遇到如下情况之一时有 ●i=j; ●结点i为仓库或充电站且结点j为充电站; ●结点j为客户且已经被访问过; ●车辆剩余容量小于结点j的需求量,即Dtdj; ●到达结点j的时间会晚于结点j的最晚服务时间,即Tt+timeijlj; ●剩余行驶里程不支持到达结点j,即Btdisij; ●到达结点j后的剩余行驶里程不支持到达任一仓库或充电站; S3.3:根据概率分布pt,选择一个结点j进行访问即执行一个动作,将此结点j加入到历史路径π中,并更新车辆状态信息,当前时间更新为: 其中,s是服务时间,c是充电时间; 当前剩余容量更新为: 其中,Dmax是车辆最大装载容量; 当前剩余行驶里程更新为: 其中Bmax是车辆最大行驶里程; S3.4:重复步骤S3.1~S3.3,直至车辆服务完所有客户结点且返回到仓库,重复步骤S3.1~S3.3过程中选择的结点序列即为问题的解。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510275 广东省广州市海珠区新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。