上海喜马拉雅科技有限公司罗欢获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海喜马拉雅科技有限公司申请的专利音频的违规审核方法、装置、电子设备及可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116186265B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310196839.6,技术领域涉及:G06F16/353;该发明授权音频的违规审核方法、装置、电子设备及可读存储介质是由罗欢;邬雨可;颜杰;余相君设计研发完成,并于2023-03-01向国家知识产权局提交的专利申请。
本音频的违规审核方法、装置、电子设备及可读存储介质在说明书摘要公布了:本发明提供了一种音频的违规审核方法、装置、电子设备及可读存储介质,涉及人工智能技术领域。在多标签分类模型的训练时,用到了训练样本集和辅助数据集,训练样本集包括若干训练音频的ASR文本,辅助数据集包括每份训练音频的目标概率向量和违规Mask向量;违规Mask向量采用不同数值表征训练音频已确定的实际违规类别和其他的待定违规类别;目标概率向量包括训练音频属于实际违规类别的概率。如此,训练时利用违规Mask向量得到的目标损失值只保留了实际违规类别的影响,使得多标签分类模型更为准确,从而在模型应用阶段能够确定出待审核音频所属的全部目标违规类别,保证了违规类别识别的全面性。
本发明授权音频的违规审核方法、装置、电子设备及可读存储介质在权利要求书中公布了:1.一种音频的违规审核方法,其特征在于,包括: 获取待审核音频,并对所述待审核音频进行语音识别,得到待审核ASR文本; 将所述待审核ASR文本输入训练后的多标签分类模型,得到违规标签预测向量,所述违规标签预测向量包括所述待审核音频属于每种违规类别的概率值; 基于所述违规标签预测向量确定所述待审核音频所属的至少一种目标违规类别; 其中,所述训练后的多标签分类模型通过以下方式训练得到: 构建训练样本集和辅助数据集,所述训练样本集包括若干训练音频的ASR文本,所述辅助数据集包括每份训练音频的目标概率向量和违规Mask向量;所述违规Mask向量采用不同数值表征所述训练音频已确定的实际违规类别和其他的待定违规类别;所述目标概率向量包括所述训练音频属于所述实际违规类别的概率; 将所述训练样本集输入多标签分类模型,得到每个ASR文本的预测概率向量,所述预测概率向量包括每种违规类别对应的概率值; 针对每个ASR文本,利用所述ASR文本的预测概率向量、目标概率向量和违规Mask向量,计算所述ASR文本的个体损失值; 基于每个ASR文本的个体损失值得到目标损失值; 利用所述目标损失值进行反向传播以更新所述多标签分类模型的模型参数,得到所述训练后的多标签分类模型; 其中,所述利用所述ASR文本的预测概率向量、目标概率向量和违规Mask向量,计算所述ASR文本的个体损失值的步骤,包括: 基于所述目标概率向量、所述预测概率向量和预设的损失函数,计算得到待定损失向量; 将所述待定损失向量与所述违规Mask向量相乘,得到目标损失向量; 将所述目标损失向量的每个损失值相加,得到所述个体损失值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海喜马拉雅科技有限公司,其通讯地址为:201100 上海市闵行区紫星路588号2幢2062室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励