腾讯科技(北京)有限公司郭卉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯科技(北京)有限公司申请的专利数据分类方法、装置及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113705598B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110254104.5,技术领域涉及:G06F18/241;该发明授权数据分类方法、装置及电子设备是由郭卉设计研发完成,并于2021-03-04向国家知识产权局提交的专利申请。
本数据分类方法、装置及电子设备在说明书摘要公布了:本申请实施例提供了一种数据分类方法、装置及电子设备,涉及人工智能技术领域。该方法包括:获取待分类数据;待分类数据包括图像数据或者文本数据;将待分类数据输入训练好的分类模型,得到待分类数据对应的分类结果。其中,分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的,各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的,样本类型为噪声样本或非噪声样本。本申请的数据分类方法,在确定分类模型的训练损失值时,将训练样本的样本类型作为考虑因素之一,可以避免噪声样本对模型训练的影响,提升模型的学习效果,从而提升训练好的分类模型的分类准确性。
本发明授权数据分类方法、装置及电子设备在权利要求书中公布了:1.一种数据分类方法,其特征在于,所述方法包括: 获取待分类数据;所述待分类数据包括图像数据或者文本数据; 将所述待分类数据输入到通过以下方式得到的训练好的分类模型,得到所述待分类数据对应的分类结果: 获取训练样本集,所述训练样本集包括各批次的训练样本,每一批次的训练样本包括带有真实类别标签的各训练样本; 对于每一批次的训练样本,通过重复执行以下训练操作直至分类模型的训练损失值满足预设的训练结束条件,得到训练好的分类模型: 对于当前批次的每一训练样本,将所述训练样本输入至分类模型中,提取所述训练样本的样本特征向量,并基于所述样本特征向量,得到所述训练样本的类别预测结果; 获取所述分类模型对应的各分类类别的类别特征向量; 对于每一训练样本,基于所述训练样本的样本特征向量和各类别特征向量的相似度,将对应的相似度大于或等于相似度阈值的各分类类别的类别标签确定为所述训练样本对应的推荐类别标签,根据所述训练样本的各推荐类别标签是否包括训练样本的真实类别标签,确定所述训练样本的样本类型,所述样本类型为噪声样本或非噪声样本; 对于每一训练样本,基于所述训练样本的样本类型,确定所述训练样本对应的训练损失值的权重;其中,噪声样本的权重小于非噪声样本对应的权重; 基于各训练样本对应的训练损失值的权重、以及各训练样本的类别预测结果和真实类别标签之间的差异,确定所述分类模型的训练损失值,基于若所述训练损失值调整所述分类模型的模型参数,并在所述训练样本集中获取下一批次的训练样本,执行下次训练操作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(北京)有限公司,其通讯地址为:100080 北京市海淀区海淀大街38号银科大厦16层1601-1608室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。