上海光羽芯辰科技有限公司请求不公布姓名获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海光羽芯辰科技有限公司申请的专利基于硬件感知的模型量化方法、系统、介质、产品及终端获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121168541B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511715158.1,技术领域涉及:G06N3/0495;该发明授权基于硬件感知的模型量化方法、系统、介质、产品及终端是由请求不公布姓名;请求不公布姓名设计研发完成,并于2025-11-21向国家知识产权局提交的专利申请。
本基于硬件感知的模型量化方法、系统、介质、产品及终端在说明书摘要公布了:本申请提供一种基于硬件感知的模型量化方法、系统、介质、产品及终端,在一个高层次软件框架与底层硬件行为模型之间构建混合执行机制,仅将初始量化模型的量化计算图中需要在目标硬件上执行的核心计算算子交由硬件行为模型进行比特精度仿真,在量化流程中模拟目标硬件的真实计算特性,而将其他辅助性、非计算密集型算子保留在高层次软件框架中执行,从而提升了仿真验证效率,兼顾了仿真精度与执行效率,实现了量化后模型在目标硬件上运行更高效、精度损失更低的目标。
本发明授权基于硬件感知的模型量化方法、系统、介质、产品及终端在权利要求书中公布了:1.一种基于硬件感知的模型量化方法,其特征在于,包括: 根据预设的高层次软件框架,对预训练的神经网路模型进行初步低精度量化操作,以得到初始量化模型,并构建初始量化模型的量化计算图以及确定所述量化计算图中各个算子的初始量化参数; 根据所述初始量化模型需部署至目标硬件的硬件资源状况,构建硬件行为模型,据以构建混合执行引擎; 基于所述混合执行引擎以及所述量化计算图中各个算子的初始量化参数,对所述初始量化模型的量化计算图执行混合仿真计算的多轮迭代,以得到最终的目标量化模型; 所述算子的类型包括核心计算算子;其中,基于所述混合执行引擎以及所述量化计算图中各个算子的初始量化参数,对所述初始量化模型的量化计算图执行混合仿真计算的多轮迭代,以得到最终的目标量化模型的方式包括: 利用所述混合执行引擎遍历所述量化计算图,并根据预设规则对所述量化计算图中不同类型的算子进行分发调度,据以执行不同类型的算子的计算,生成各个所述核心计算算子所对应的低精度仿真计算结果;所述算子的类型包括通用辅助算子;其中,利用所述混合执行引擎遍历所述量化计算图,并根据预设规则对所述量化计算图中不同类型的算子进行分发调度,据以执行不同类型的算子的计算的方式包括:若所述算子的类型是通用辅助算子,则调用预设的所述高层次软件框架执行计算;若所述算子的类型是核心计算算子,则执行算子融合操作以及算子重映射操作,以调用所述硬件行为模型中对应的硬件功能模块执行计算;所述执行算子融合操作以及算子重映射操作的方式包括:若所述算子的类型是核心计算算子,则执行算子拦截操作,以生成逻辑组合算子序列;对所述逻辑组合算子序列执行算子融合操作,以生成复合算子;对所述复合算子执行算子重映射操作,以构建所述复合算子与所述硬件行为模型中硬件功能模块的映射关系; 根据各个所述核心计算算子所对应的低精度仿真计算结果,执行所述量化计算图的优化操作; 基于优化操作后的所述量化计算图,执行混合仿真计算的多轮迭代,以得到最终的目标量化模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海光羽芯辰科技有限公司,其通讯地址为:201400 上海市奉贤区川南奉公路9222号1幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励