浙江大学张超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利强化学习数据采样方法、系统、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116776962B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310619912.6,技术领域涉及:G06N3/092;该发明授权强化学习数据采样方法、系统、设备和存储介质是由张超;陈楚凡;张云淞;钱徽设计研发完成,并于2023-05-29向国家知识产权局提交的专利申请。
本强化学习数据采样方法、系统、设备和存储介质在说明书摘要公布了:本申请涉及一种强化学习数据采样方法、系统、设备和存储介质,通过中心节点获取环境交互节点生成的环境状态样本,将环境状态样本存储至经验集,将环境状态样本发送至动作计算节点,接收并存储动作计算节点生成的动作样本,将动作样本发送至环境交互接单,继续接收并处理环境交互节点根据动作样本进行更新后的环境状态样本,并根据环境状态样本与动作样本生成轨迹样本,当经验集存储的轨迹样本的数量达到第一阈值时,将轨迹样本发送至策略更新节点,策略更新节点根据轨迹样本对模型进行优化,并将优化后的模型参数发送至动作计算节点,保证了各种节点信息的高效读写,解决了相关技术中强化学习在计算资源有限的情况下采样效率较低的问题。
本发明授权强化学习数据采样方法、系统、设备和存储介质在权利要求书中公布了:1.一种强化学习数据采样方法,应用于强化学习的模型训练,其特征在于,包括: 获取环境交互节点生成的环境状态样本,将所述环境状态样本存储至中心节点的经验集;所述中心节点包括高速读写模块,所述高速读写模块用于创建所述中心节点与目标节点之间的会话,并基于所述会话对样本数据进行读写操作,其中,所述目标节点包括所述环境交互节点、动作计算节点或者策略更新节点,所述样本数据包括所述环境状态样本、动作样本或者轨迹样本;所述高速读写模块对所述经验集的存储空间进行分页封装,每一页所述存储空间对应不同的地址信息;所述高速读写模块对不同页的所述存储空间进行并行读写; 将所述环境状态样本发送至所述动作计算节点,接收所述动作计算节点根据模型参数以及所述环境状态样本生成的所述动作样本,并将所述动作样本存储至所述经验集; 将所述动作样本发送至所述环境交互节点,继续接收并处理所述环境交互节点根据所述动作样本进行更新后的所述环境状态样本;根据所述经验集中的所述环境状态样本与对应的所述动作样本生成所述轨迹样本,当所述经验集存储的所述轨迹样本的数量达到第一阈值时,将所述轨迹样本发送至所述策略更新节点,所述策略更新节点根据所述轨迹样本对模型进行优化,并输出优化后的所述模型参数至所述动作计算节点,其中,所述第一阈值根据模型复杂度、模型收敛速度与模型其他指标动态调整得到。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310013 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励