Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京大学燕博南获国家专利权

北京大学燕博南获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京大学申请的专利一种高效的强化学习的训练加速系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119067185B

龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411097118.0,技术领域涉及:G06N3/063;该发明授权一种高效的强化学习的训练加速系统及方法是由燕博南;李嘉怡;金玉丰;杨玉超;黄如设计研发完成,并于2024-08-12向国家知识产权局提交的专利申请。

一种高效的强化学习的训练加速系统及方法在说明书摘要公布了:本发明一种高效的强化学习的训练加速系统及方法,属于强化学习的加速领域。本发明一种强化学习的训练加速系统包括在CPU上的软件系统和在FPGA上的硬件系统;在该系统上实现的强化学习的训练加速方法,完成并行m个环境的强化学习训练过程中一个计算步step的计算包括:CPU端数据预处理,CPU端发送数据给FPGA,FPGA端对收到的数据进行缓存,FPGA端做环境的并行计算和计算结果缓存,CPU端从FPGA端读取计算结果数据,CPU端解包结果数据用于更新训练模型;该方法运用本地存储技术,流水线技术和时分复用技术使,提升了运算速度,实现了强化学习环境更新的硬件加速;采用模块化和参数化设计,通用性强;通过加速强化学习的环境更新这部分,最终加速了强化学习的训练过程。

本发明授权一种高效的强化学习的训练加速系统及方法在权利要求书中公布了:1.一种高效的强化学习的训练加速系统,其特征在于,由软件部分和硬件部分组成,软 件部分在CPU上实现,包括数据打包模块、数据传输模块、数据控制模块和数据解包模块,用于将强化学习训练过程中的神经网络前向传播、模型训练和在硬件中进行的环境更新连接起来;硬件部分在FPGA上实现,包括数据传输模块、并行计算控制模块、数据缓冲模块和环境计算模块,用于在硬件上实现环境更新的并行计算; 所述软件部分,数据打包模块用于将强化学习训练过程中的环境的初始状态以及根据当前策略智能体的动作信息,进行数据压缩并打包成字节的形式,使得用更少的字节数包含更多的环境信息;数据传输模块用于CPU端和FPGA端之间的数据传输,将打包后的字节数据从CPU端发送给FPGA端,也包括CPU端从FPGA端读取字节数据;数据控制模块控制数据传输模块在FPGA端环境的计算完成之后再从FPGA端读取数据;数据解包模块将从FPGA端读取的字节形式的数据解包成训练过程中需要的数据格式; 所述硬件部分,数据传输模块和CPU端软件部分的数据传输模块相连,用于CPU端和FPGA端之间的数据传输,接收CPU端发送的数据;数据缓冲模块包括寄存器和存储器BRAM两种存储类型的存储介质,用于存储接收到的数据、计算过程中的中间数据和计算完成的数据;并行计算控制模块用于控制FPGA端的数据缓冲模块和环境计算模块之间的数据流动;环境计算模块由若干个单个环境的计算模块组成,每个单个环境的计算模块对应一块能够计算单个环境的硬件资源,针对不同的环境任务,都以环境的当前状态和环境对应的智能体的动作为输入,以环境的下一个阶段的状态、智能体对环境的观测值、智能体所获得的奖励和当前任务是否截止为环境计算模块的输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100871 北京市海淀区颐和园路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。