清华大学赵明国获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学申请的专利一种优先级分层学习方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113592098B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110850789.X,技术领域涉及:G06N20/00;该发明授权一种优先级分层学习方法是由赵明国;李沛阳;韩新宇设计研发完成,并于2021-07-27向国家知识产权局提交的专利申请。
本一种优先级分层学习方法在说明书摘要公布了:本发明本提出一种优先级分层学习方法,对于有N个不同优先级的任务,对于优先级i的任务,记其评价函数为Qi,并维护一个预测模型πi;对于优先级i的任务,以及所有更高优先级任务j<i,准备一个预先确定的阈值εij,并维护一个松弛变量λij;对于任意i>j,如果Qjπi+εij<Qjπj,则表示πi在任务j上的表现比πj差太多了,则增大λij;反之则减小λij,但保持λij>0。以λij,j<i作为权重优化πi:重复前面的步骤直到收敛,最终得到的πN就是所求的模型。本发明方法中,用约束描述优先级,解决了传统多目标优化方法没有优先级顺序的问题。引入松弛变量,自动调整各个优化目标的权重。对偶变量自适应调节,与原问题零对偶间隙,为凸优化问题,现有求解器可快速求解。
本发明授权一种优先级分层学习方法在权利要求书中公布了:1.一种优先级分层学习方法,其特征在于,步骤如下: 步骤1:对于有N个不同优先级的任务,对于优先级i的任务,记其评价函数为Qi,并维护一个策略模型πi; 策略模型πi控制一台机器人在仿真环境中尽可能快地前进,同时要保证机器人的身体竖直、能耗尽量小; 所述步骤1中的N为3;第1个任务是保证机器人的身体竖直;第2个任务是控制机器人尽可能快地前进;第3个任务是降低机器人的能量消耗;规定第1个任务拥有最高优先级;第3个任务拥有最低优先级; 步骤2:对于优先级i的任务,以及所有更高优先级任务ji,准备一个预先确定的阈值εij,并维护一个松弛变量λij; 步骤3:对于任意ij,如果Qjπi+εijQjπj,则表示πi在任务j上的表现比πj差太多了,则增大λij;反之则减小λij,但保持λij0; 步骤4:以λij,ji作为权重优化πi: 对于优先级i的任务,采样得到一组输入st、输出at、回报rt; 使用常规方法更新评价函数Qi:αQi为评价函数学习速率,γi为回报衰减速率; 更新松弛变量βi为松弛变量学习速率; 更新策略模型αi为策略模型学习速率; 步骤5:重复步骤3和步骤4,直到收敛,最终得到的πN就是所求的模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区清华园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励