北京沃东天骏信息技术有限公司王家兴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京沃东天骏信息技术有限公司申请的专利模型训练方法、任务处理方法、装置、程序产品和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118917440B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411322812.8,技术领域涉及:G06N20/00;该发明授权模型训练方法、任务处理方法、装置、程序产品和设备是由王家兴;李勇;宫礼星;陶通;刘朋樟;包勇军设计研发完成,并于2024-09-20向国家知识产权局提交的专利申请。
本模型训练方法、任务处理方法、装置、程序产品和设备在说明书摘要公布了:本公开提供一种模型训练方法及装置、任务处理方法及装置、计算机程序产品和电子设备,涉及计算机技术领域。该模型训练方法包括:从初始训练样本集中采集当前训练批次的训练样本,训练样本包括基于样本评估模型从初始训练样本集中获取的困难样本;基于训练样本对大语言模型进行训练,并根据训练样本的训练损失值对训练样本标注类别标签,类别标签用于指示训练样本是否为困难样本;根据训练样本和对应的类别标签对样本评估模型进行训练,以完成当前训练批次;进入下一训练批次,直到大语言模型完成训练停止,得到训练完成的大语言模型。本公开可提高大语言模型的训练精度和训练效率。
本发明授权模型训练方法、任务处理方法、装置、程序产品和设备在权利要求书中公布了:1.一种模型训练方法,应用于文本生成,其特征在于,包括: 从用于文本生成的初始训练样本集中采集当前训练批次的训练样本,所述训练样本包括基于样本评估模型从所述用于文本生成的初始训练样本集中获取的困难样本;其中,样本评估模型是用于评估训练样本的难易度的模型,所述样本的难易度是指对文本样本进行学习的难易程度; 基于所述训练样本对大语言模型进行训练,并根据所述训练样本的训练损失值对所述训练样本标注类别标签,所述类别标签用于指示所述训练样本是否为困难样本; 根据所述训练样本和对应的类别标签对所述样本评估模型进行训练,以完成当前训练批次; 进入下一训练批次,直到所述大语言模型完成训练停止,得到训练完成的大语言模型; 其中,从用于文本生成的初始训练样本集中采集当前训练批次的训练样本,包括: 根据初始样本保留率从所述用于文本生成的初始训练样本集中采集第一训练样本; 针对所述用于文本生成的初始训练样本集中的未采集样本,利用所述样本评估模型对所述未采集样本进行困难度评估,并将评估结果为困难样本的未采集样本确定为第二训练样本; 根据所述第一训练样本和第二训练样本确定所述当前训练批次的训练样本; 所述基于所述训练样本对大语言模型进行训练,并根据所述训练样本的训练损失值对所述训练样本标注类别标签,包括: 获取当前困难度阈值,用于区分训练样本的类别的损失阈值,在整个训练过程中不固定,为根据所述大语言模型的训练过程中的损失确定; 若所述训练样本的训练损失值大于所述当前困难度阈值,则确定所述训练样本的类别标签为困难样本; 否则,将所述训练样本的类别标签确定为非困难样本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京沃东天骏信息技术有限公司,其通讯地址为:100176 北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励