Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 首都师范大学李冰获国家专利权

首都师范大学李冰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉首都师范大学申请的专利一种基于强化学习框架的自动剪枝量化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116402115B

龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310308115.6,技术领域涉及:G06N3/082;该发明授权一种基于强化学习框架的自动剪枝量化方法及系统是由李冰;王炳猛;姜宝伟设计研发完成,并于2023-03-27向国家知识产权局提交的专利申请。

一种基于强化学习框架的自动剪枝量化方法及系统在说明书摘要公布了:本发明总的来说涉及深度学习技术领域,提出一种基于强化学习框架的自动剪枝量化方法及系统,该方法包括:构造用于自动剪枝量化方法的环境,所述环境基于与网络结构相关的静态信息以及与压缩状态相关的动态信息;构造自动剪枝量化智能体;以及使所述自动剪枝量化智能体与所述环境进行交互,以训练所述自动剪枝量化智能体并且输出压缩策略。本发明可以针对轻量化和非轻量化的图像识别神经网络模型同时搜索出最佳的逐层剪枝和逐层量化策略;并且本发明通过新的剪枝后的模型更新算法、最佳策略使搜索完成时间大幅降低;此外本发明在模型参数量和计算复杂度降低的同时,使压缩后模型的识别准确度得到了提高。

本发明授权一种基于强化学习框架的自动剪枝量化方法及系统在权利要求书中公布了:1.一种基于强化学习框架的自动剪枝量化方法,其特征在于,包括下列步骤: 构造用于自动剪枝量化方法的环境,所述环境基于与网络结构相关的静态信息以及与压缩状态相关的动态信息; 构造自动剪枝量化智能体;以及 使所述自动剪枝量化智能体与所述环境进行交互,以训练所述自动剪枝量化智能体并且输出压缩策略,所述压缩策略包括剪枝策略和量化策略; 其中所述静态信息包括: 层指标,其包括当前正在压缩网络的第层; 层维度,其包括输入的数据大小、输出的数据大小、卷积核大小以及步幅大小;以及 模型大小,其包括网络的总参数量;和\或 所述动态信息包括: 剪枝信息,其包括已剪枝层减少的总浮点操作数以及未剪枝层的总浮点操作数; 量化信息,其包括已量化的比特参数量以及未量化的比特参数量;以及 策略信息,其包括神经网络模型层的剪枝策略、权重量化策略以及激活值量化策略; 其中基于深度确定性策略梯度算法构造所述自动剪枝量化智能体,其中所述自动剪枝量化智能体包括: 策略网络,其包括第一至第三全连接层,第一至第二修正线性单元激活层以及第一S型激活层;以及 评价网络,其包括第四至第七全连接层以及第三至第四修正线性单元激活层; 其中所述自动剪枝量化智能体与所述环境进行交互包括: 在收集信息阶段,由所述自动剪枝量化智能体采样收集策略经验并且不更新网络,其中将收集到的元组存入经验回放集合,其中表示最后一层的奖励,表示剪枝前的环境,表示量化后的环境,表示剪枝和量化策略,用于指示是否为最后一层;以及 在训练更新阶段,由所述自动剪枝量化智能体根据环境信息通过所述策略网络同时生成剪枝策略以及量化策略,并且通过正态分布截断增加噪音; 其中所述自动剪枝量化智能体根据环境信息通过所述策略网络同时生成剪枝策略以及量化策略包括由所述自动剪枝量化智能体执行下列动作: 在第层根据剪枝前环境生成剪枝和量化策略; 使用第层的剪枝策略与环境交互,并且根据剪枝后的环境生成权重量化策略和激活值量化策略;以及 合并策略以生成第层的压缩策略; 其中训练所述自动剪枝量化智能体并且输出压缩策略包括由所述自动剪枝量化智能体执行下列动作: 初始化当前评价网络,输出值以及当前策略网络,输出策略; 复制上述当前网络得到目标评价网络,输出值以及目标策略网络以便更新; 从所述经验回放集合中采样m个样本; 使用剪枝前的环境信息以及压缩策略通过当前评价网络计算得到值,表示为下式:; 根据量化后的环境信息,最后一层的奖励以及目标策略网络预测的下一层压缩策略,通过目标评价网络计算值,表示为下式: ; 最小化均方差函数为优化目标,通过梯度下降和反向传播更新当前评价网络; 使用更新后的当前评价网络,并根据最小化计算梯度,通过梯度下降和反向传播方法更新当前策略网络;以及 更新目标评价网络以及目标策略网络,表示为下式: 其中,表示超参数; 其中所述自动剪枝量化智能体在给出每一层的剪枝策略后,根据L1范数进行通道选择,并且使用最小二乘法重新构建特征图;和\或 所述自动剪枝量化智能体在给出每一层的量化策略后,使用线性量化方法进行权重量化以及激活值量化,表示为下式: 其中,表示截断值、表示缩放因子、表示量化位宽、表示四舍五入取整、X表示原始参数值,表示量化后参数值;其中包括:对权重、输入的数据进行直方图统计,获得相应的频数和组的端点值;根据强化学习算法给出的位宽算出量化后的数据范围,并且在和直方图极值之间给出可能的量化截断值和相应的缩放因子;利用线性插值法估算出在不同的量化截断值情况下量化后的值,根据噪信比确定最佳的截断值;以及利用第三步确定的截断值和缩放因子进行量化;和\或 所述自动剪枝量化智能体在给出每一层的量化策略后,使用SAT量化方法进行权重量化并且使用PACT量化方法进行激活值量化, 其中SAT量化方法表示为下式: 其中,是权重量化后的权重值,表示模型每一层的输出数; PACT方法的量化公式表示为下式: ;和\或 所述自动剪枝量化智能体在给出每一层的量化策略后,使用PWLQ量化网络进行权重量化以及激活值量化,其中参数量化公式表示为下式: 其中包括:在权重量化时寻找数据的一个断点,将权重值分为,,三个区间;对于分布在和中的权重采用无符号的均匀量化,对于中的权重采用有符号的均匀量化,使用公式确定断点,其中为断点,为权重最值的绝对值;以及在激活值量化时,使用随机的多个训练图作为校准集,并计算训练图靠前的中值作为量化的截断值,并且进行均匀量化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人首都师范大学,其通讯地址为:100048 北京市海淀区西三环北路105号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。