海信视像科技股份有限公司徐泽坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉海信视像科技股份有限公司申请的专利基于多种损失融合文本分类模型结果的训练语料筛选方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114116969B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111341075.2,技术领域涉及:G06F16/334;该发明授权基于多种损失融合文本分类模型结果的训练语料筛选方法是由徐泽坤;岳文浩设计研发完成,并于2021-11-12向国家知识产权局提交的专利申请。
本基于多种损失融合文本分类模型结果的训练语料筛选方法在说明书摘要公布了:本申请提供一种基于多种损失融合文本分类模型结果的训练语料筛选方法,在文本分类模型的模型层面,通过对多种损失函数进行融合,让文本分类模型自适应学习各损失函数对文本分类模型分类效果的权重,进而提升文本分类模型的鲁棒性。在数据层面,基于上述多种损失函数融合的文本分类模型结果,通过方差计算来判断训练样本数据的输出类别划分质量,找出质量较差的待筛选回查数据,并对待筛选回查数据进行回查处理。根据处理结果对文本分类模型进行再次训练,提升文本分类模型的分类或预测效果。通过计算输出类别之间的混淆度,对文本分类模型的分类体系做出一个量化得分,作为调整文本分类模型中分类定义的依据,进而提升文本分类模型的预测效果。
本发明授权基于多种损失融合文本分类模型结果的训练语料筛选方法在权利要求书中公布了:1.基于多种损失融合文本分类模型结果的训练语料筛选方法,其特征在于,包括: 将文本分类模型按照功能划分为模型层面和数据层面; 在所述模型层面,对所述文本分类模型进行多种损失函数融合,得到文本分类模型中训练样本数据的输出类别及类别概率值; 在所述数据层面,根据所述输出类别及所述类别概率值计算所述训练样本数据的方差; 筛选出待筛选回查数据,所述待筛选回查数据的方差低于方差阈值,所述方差阈值根据所述训练样本数据本身的输出类别预先设定; 生成每个所述输出类别对应的问题样本,所述问题样本包含所述输出类别中所有的待筛选回查数据; 根据所述问题样本生成所述待筛选回查数据的标签对,将所有相同标签对的所述待筛选回查数据归为同一个标签对类,所述标签对类中包括两个所述输出类别; 计算所述标签对类中两个所述输出类别的混淆度; 根据所述混淆度调整所述文本分类模型中的分类定义。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人海信视像科技股份有限公司,其通讯地址为:266555 山东省青岛市经济技术开发区前湾港路218号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励