Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙大城市学院王铮获国家专利权

浙大城市学院王铮获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙大城市学院申请的专利一种融合边权注意力深度强化学习的应急物资调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115619118B

龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211051218.0,技术领域涉及:G06Q10/0631;该发明授权一种融合边权注意力深度强化学习的应急物资调度方法是由王铮;赵燕伟;陈浩立设计研发完成,并于2022-08-30向国家知识产权局提交的专利申请。

一种融合边权注意力深度强化学习的应急物资调度方法在说明书摘要公布了:本发明公开了一种融合边权注意力深度强化学习的应急物资调度方法,包括:基于应急物资调度问题构建马尔科夫决策过程;构建策略网络模型,随机生成一定分布下的应急物资调度模拟数据,将所述应急物资调度模拟数据输入所述策略网络模型,并基于带有回滚基准的REINFORCE算法对所述策略网络模型进行离线训练;基于2‑opt局部搜索策略对训练后的策略网络模型的局部较优解进行改进,获取应急物资调度方案。本发明利用经过离线训练的网络模型,能够以毫秒级的时间内快速求解,本发明构建的策略网络模型,并结合2‑opt局部搜索策略对模型进行改进,相比于现有深度强化学习方法,本发明更具现实应用价值。

本发明授权一种融合边权注意力深度强化学习的应急物资调度方法在权利要求书中公布了:1.一种融合边权注意力深度强化学习的应急物资调度方法,其特征在于,包括以下步骤: 基于应急物资调度问题构建马尔科夫决策过程; 构建策略网络模型,基于所述马尔科夫决策过程随机生成一定分布下的应急物资调度模拟数据,将所述应急物资调度模拟数据输入所述策略网络模型,并基于带有回滚基准的REINFORCE算法对所述策略网络模型进行离线训练; 基于2-opt局部搜索策略对训练后的策略网络模型的局部较优解进行改进,获取应急物资调度方案; 所述策略网络模型由解码器-编码器构成,其中: 所述编码器由嵌入层和若干个注意力模块组成,所述嵌入层将输入节点特征映射到更高维空间特征,每个所述注意力模块通过计算节点之间的关注程度获得节点的隐含特征,所述注意力模块由边权注意力层和前馈层组成; 所述解码器包括嵌入层、边权注意力层以及一个单头的边权注意力层,所述解码器基于所述编码器提取的高层特征输出动作选择概率向量,为智能体的下一时刻动作选择进行指导; 所述编码器的特征传递计算公式如下所示: 其中,公式4为嵌入层特征传递计算公式,WX为嵌入层网络参数,xi表示节点i输入特征,包括节点物资需求量以及节点受灾等级,公式5为边权注意力层特征传递计算公式,BatchNorm表示批归一化处理,l∈[1,N]表示第l个注意力模块,公式6为前馈层特征传递计算公式,公式7为前向传播计算公式,ReLu为神经元激活函数,W1FF、W2FF为前馈层网络参数; 所述解码器的特征传递计算如下所示: 其中公式8为嵌入层特征传递计算公式,WC表示嵌入层网络参数,concat为特征拼接函数,公式9为边权注意力层计算公式,作为注意力查询向量对当前车辆可访问节点进行注意力计算,所述的访问节点包括应急仓库点和所需物资量小于当前车辆剩余容量的受灾点,公式10表示单头边权注意力计算公式。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙大城市学院,其通讯地址为:310015 浙江省杭州市拱墅区湖州街51号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。