Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 兰州理工大学陈辉获国家专利权

兰州理工大学陈辉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉兰州理工大学申请的专利基于自蒸馏算法优化的MAAC多目标跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120219434B

龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510302282.9,技术领域涉及:G06T7/246;该发明授权基于自蒸馏算法优化的MAAC多目标跟踪方法是由陈辉;董周楠;马小航;姜越;张文旭;卢钟德;王其洋;殷翼鹏;王耿林;强博设计研发完成,并于2025-03-14向国家知识产权局提交的专利申请。

基于自蒸馏算法优化的MAAC多目标跟踪方法在说明书摘要公布了:本发明公开了基于自蒸馏算法优化的MAAC多目标跟踪方法,包括:将智能体与环境进行交互,生成交互经验回放,利用结构相同的教师网络和学生网络通过双策略循环模式进行学习,完成有限视野智能体的多目标跟踪;其中,双策略循环模式为所述教师网络通过与环境交互生成高误差和高回报经验,训练集中式评论家网络并指导行动家网络更新;所述学生网络在蒸馏阶段通过平滑L1损失和逆KL散度学习所述教师网络的价值函数与动作分布,最终覆盖教师网络参数实现多目标跟踪优化。设计了独立的教师策略目标评论家网络,在训练过程中不参与循环覆盖,采用了特殊损失函数设计,加速了学生网络的收敛过程并有效提升了策略的优化效果。

本发明授权基于自蒸馏算法优化的MAAC多目标跟踪方法在权利要求书中公布了:1.基于自蒸馏算法优化的MAAC多目标跟踪方法,其特征在于,包括: 将智能体与环境进行交互,生成交互经验回放,利用结构相同的教师网络和学生网络通过双策略循环模式进行学习,完成有限视野智能体的多目标跟踪,所述智能体为与环境互动并采取行为的实体; 其中,所述双策略循环模式为所述教师网络通过与环境交互生成第一经验和第二经验,训练集中式评论家网络并指导行动家网络更新;所述学生网络在蒸馏阶段通过平滑L1损失和逆KL散度学习所述教师网络的价值函数与动作分布,最终覆盖教师网络参数实现多目标跟踪优化; 利用结构相同的教师网络和学生网络通过双策略循环模式进行学习包括: 分别初始化所述教师网络和所述学生网络; 将初始化后的教师网络与环境交互生成交互经验,根据预设的奖励机制评估交互表现,将交互经验存储至优先经验回放池,其中,所述预设的奖励机制包括距离奖励、防触碰奖励和边界奖励; 从所述优先经验回放池中按优先级顺序分别提取基于时序差分误差的第一经验和基于奖励值的第二经验; 利用所述第一经验和所述第二经验训练教师评论家网络,并通过软更新策略更新教师策略的目标评论家网络; 基于教师评论家网络的输出,指导各智能体的行动家网络进行策略梯度更新; 在蒸馏阶段,所述学生网络通过平滑L1损失学习所述教师网络的价值函数,并通过逆KL散度学习教师网络的动作分布; 当蒸馏阶段结束时,将学生网络的参数覆盖教师网络的参数,完成双策略循环迭代; 通过下式2对距离奖励进行设置: 其中,为当前智能体的追踪奖励,为智能体的有限视野检测范围, 为智能体和追踪目标的欧几里得距离; 通过式3对防触碰奖励进行设置: 其中,为防触碰奖励,为定义的安全距离,为智能体和智能 体的欧几里得距离; 通过式4对边界奖励进行设置: 其中,为边界奖励,为安全距离阈值,为智能体到达边界的最近距离。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人兰州理工大学,其通讯地址为:730050 甘肃省兰州市七里河区兰工坪路287号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。