中铁高新工业股份有限公司浦宪功获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中铁高新工业股份有限公司申请的专利面向工业场景的大模型轻量化与边缘推理加速方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121146097B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511688054.6,技术领域涉及:G06N5/04;该发明授权面向工业场景的大模型轻量化与边缘推理加速方法和装置是由浦宪功;赵丹丹;成凯;刘新成;谷雨;卜佳男;鲁永强;刘子琦;张维;陈传川设计研发完成,并于2025-11-18向国家知识产权局提交的专利申请。
本面向工业场景的大模型轻量化与边缘推理加速方法和装置在说明书摘要公布了:本公开涉及大数据技术领域,具体公开了一种面向工业场景的大模型轻量化与边缘推理加速方法和装置。所述方法包括:获取原始大模型,对所述原始大模型进行轻量化处理,得到中间大模型;以所述原始大模型作为教师模型,对所述中间大模型进行知识蒸馏训练,得到目标大模型;其中,所述知识蒸馏训练包括将所述教师模型的输出层的软标签分布和中间层的注意力特征数据迁移至所述中间大模型;根据目标边缘设备的硬件类型,确定目标大模型的部署策略;根据所述部署策略,将所述目标大模型部署至所述目标边缘设备。采用本方法能够有效降低模型的计算复杂度和存储需求,同时保留较高的推理精度。
本发明授权面向工业场景的大模型轻量化与边缘推理加速方法和装置在权利要求书中公布了:1.一种面向工业场景的大模型轻量化与边缘推理加速方法,其特征在于,包括以下步骤: 获取原始大模型,其中,所述原始大模型为经过工业数据集预训练得到; 对所述原始大模型进行敏感性分析,确定所述原始大模型不同层的模型参数和结构组件对模型预测性能的影响程度,并根据所述影响程度,确定所述原始大模型的非敏感部分; 对所述非敏感部分所对应的层,进行低精度量化,得到中间子模型;其中,所述低精度量化包括将所述原始大模型的模型参数从高位宽浮点数表示转换为低位宽整数或低位宽浮点数表示; 对所述中间子模型进行结构化剪枝,得到中间大模型;其中,所述结构化剪枝用于移除被识别为冗余的结构组件; 以所述原始大模型作为教师模型,对所述中间大模型进行知识蒸馏训练,得到目标大模型;其中,所述知识蒸馏训练包括将所述教师模型的输出层的软标签分布和中间层的注意力特征数据迁移至所述中间大模型; 根据目标边缘设备的硬件类型,确定目标大模型的部署策略;其中,所述部署策略包括算子融合策略、内存访问优化策略和定制化知识产权核中的至少一种; 根据所述部署策略,将所述目标大模型部署至所述目标边缘设备;其中,所述目标大模型用于工业质量检测、设备故障诊断和参数优化中的至少一种。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中铁高新工业股份有限公司,其通讯地址为:100070 北京市丰台区汽车博物馆西路10号院5号楼1至9层101内7层707;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励