鹏城实验室李靓获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉鹏城实验室申请的专利大模型微调训练方法、装置、设备、存储介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119692419B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411772769.5,技术领域涉及:G06N3/084;该发明授权大模型微调训练方法、装置、设备、存储介质及产品是由李靓;吴稳设计研发完成,并于2024-12-04向国家知识产权局提交的专利申请。
本大模型微调训练方法、装置、设备、存储介质及产品在说明书摘要公布了:本申请公开了一种大模型微调训练方法、装置、设备、存储介质及产品,涉及网络智能技术领域,所述的方法包括:通过端侧设备将标签数据集输入至大模型中进行前向传播计算,并将各Trm层间的输出激活值传输至辅助算力节点设备。辅助算力节点设备将输出激活值与旁路网络适配器中的每层输出融合执行前向传播计算,端侧设备将目标输出与最后一个Trm层的输出融合获得模型输出。根据模型输出和本地标签数据集确定损失值,以使辅助算力节点设备根据损失值进行反向传播参数更新。从而避免经过端侧设备的主干网络,降低训练过程的总内存开销,实现将端侧设备内存压力向辅助算力节点的有效迁移,使内存受限的端侧设备高效执行大模型微调任务。
本发明授权大模型微调训练方法、装置、设备、存储介质及产品在权利要求书中公布了:1.一种大模型微调训练方法,其特征在于,所述方法应用于端侧设备,所述端侧设备中部署有经量化压缩后的预训练大模型,所述的方法包括: 将采样后的标签数据集输入至所述预训练大模型中进行前向传播计算,并将所述预训练大模型中的各Transformer层间的输出激活值传输至辅助算力节点设备,以使所述辅助算力节点设备以所述输出激活值与旁路网络适配器中的每层输出进行融合的方式执行前向传播计算,并将最后一层适配器的目标输出反馈至所述端侧设备; 接收所述辅助算力节点设备反馈的目标输出,并将所述目标输出与所述预训练大模型中Transformer层的最后一层的输出进行融合,获得模型输出; 根据所述模型输出和本地标签数据集确定损失值,并将所述损失值传输至所述辅助算力节点设备,以使所述辅助算力节点设备根据所述损失值对所述旁路网络适配器进行反向传播参数更新。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人鹏城实验室,其通讯地址为:518000 广东省深圳市南山区兴科一街2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励