Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连海事大学张程伟获国家专利权

大连海事大学张程伟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连海事大学申请的专利面向公平自适应交通信号控制的多智能体强化学习方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116992928B

龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310821696.3,技术领域涉及:G06N3/047;该发明授权面向公平自适应交通信号控制的多智能体强化学习方法是由张程伟;方婉青;赵心田设计研发完成,并于2023-07-05向国家知识产权局提交的专利申请。

面向公平自适应交通信号控制的多智能体强化学习方法在说明书摘要公布了:本发明公开了一种面向公平自适应交通信号控制的多智能体强化学习方法,包括:将面向公平的自适应交通信号控制问题建模为约束马尔科夫博弈,目标是寻找一个最优的联合策略能在最大化所有智能体的平均期望回报的同时满足每个智能体的成本约束;在所述约束马尔可夫博弈的基础上,使用置信域策略优化代理函数优化平均期望回报中的累积折扣奖励和折扣成本,采用拉格朗日乘子法将有约束问题转化为无约束问题;采用车辆公平性多智能体近似策略优化,学习所述无约束问题在满足等待时间约束下最大化整体回报的协作控制策略。本发明在针对多交叉口进行交通信号控制时,同时兼顾了效率和公平性。

本发明授权面向公平自适应交通信号控制的多智能体强化学习方法在权利要求书中公布了:1.一种面向公平自适应交通信号控制的多智能体强化学习方法,其特征在于,所述方法包括: 将面向公平的自适应交通信号控制问题建模为约束马尔科夫博弈,目标是寻找一个最优的联合策略能在最大化所有智能体的平均期望回报的同时满足每个智能体的成本约束; 在所述约束马尔可夫博弈的基础上,使用置信域策略优化代理函数优化平均期望回报中的累积折扣奖励和折扣成本,采用拉格朗日乘子法将有约束问题转化为无约束问题; 采用车辆公平性多智能体近似策略优化,学习所述无约束问题在满足等待时间约束下最大化整体回报的协作控制策略; 其中,用于优化累积折扣奖励的置信域策略优化代理函数,包括: ; 其中,和分别是当前策略和下一个候选策略,s是状态,是智能体的动作,为折扣访问频率,是智能体的平均期望回报,是奖励优势函数; 其中,用于折扣成本函数的置信域策略优化代理函数,包括: ; 其中,和分别是当前策略和下一个候选策略,是智能体的平均期望成本,是成本优势函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连海事大学,其通讯地址为:116026 辽宁省大连市高新园区凌海路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。