南京市公安局张涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京市公安局申请的专利训练方法、系统、介质及跨信道及方言的声纹识别模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115762479B 。
龙图腾网通过国家知识产权局官网在2026-01-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211221436.4,技术领域涉及:G10L15/02;该发明授权训练方法、系统、介质及跨信道及方言的声纹识别模型是由张涛;陈永俊;许超;梅启源;高宇航;郭林;黄雪梅;冯瑞;郭锐;彭超韡;夏爱成;卢婷婷;王扬设计研发完成,并于2022-10-08向国家知识产权局提交的专利申请。
本训练方法、系统、介质及跨信道及方言的声纹识别模型在说明书摘要公布了:本发明涉及说话人识别技术领域,具体地说,涉及一种训练方法、系统、介质及跨信道及方言的声纹识别模型。该声纹识别模型具有依次连接的第一输入层、第一卷积层、声纹特征提取网络层、前馈网络层和第一输出层,对该声纹识别模型进行训练时,包括如下步骤:步骤S1、构建文本特征提取网络、第二输出层及第三输出层;步骤S2、构建训练集X;步骤S3、初始化声纹识别模型的参数;步骤S4、训练声纹识别模型并构建损失函数L;步骤S5、更新声纹识别模型的参数;步骤S6、重复步骤S4及S5,直至损失函数最优,完成声纹识别模型的训练。本发明能够较佳地提升所训练模型的泛化性和鲁棒性。
本发明授权训练方法、系统、介质及跨信道及方言的声纹识别模型在权利要求书中公布了:1.跨信道及方言的声纹识别模型的训练方法,该声纹识别模型具有依次连接的第一输入层、第一卷积层、声纹特征提取网络层、前馈网络层和第一输出层,第一输入层用于获取语音特征序列,声纹特征提取网络层用于输出语音表征序列,第一输出层用于输出说话人预测序列; 对该声纹识别模型进行训练时,包括如下步骤: 步骤S1、构建文本特征提取网络、第二输出层及第三输出层; 其中,文本特征提取网络用于获取文本特征序列并输出文本表征序列,第二输出层与前馈网络层连接并用于输出信道预测序列,第三输出层与前馈网络层连接并用于输出文本预测序列; 步骤S2、构建训练集X; 其中,,;N为样本总数,为第i个样本,、、和分别为样本的说话人标签、信道标签、语音数据和文本数据; 步骤S3、初始化声纹识别模型的参数; 步骤S4、训练声纹识别模型并构建损失函数L; 在对训练声纹识别模型时,对语音表征序列和文本表征序列进行融合并获取融合特征序列,之后以融合特征序列作为前馈网络层的输出进而获取说话人预测序列、信道预测序列和文本预测序列; 其中,融合特征序列中任一特征的值为语音表征序列和文本表征序列中对应特征的值的算术和; 其中,;、和分别为用于表征信道、说话人和文本数据的预测值与真实值间的差异的损失函数,、和分别为损失函数、和的权重,、和的取值区间均为0,1且人为设定; 步骤S5、更新声纹识别模型的参数; 步骤S6、重复步骤S4及S5,直至损失函数最优,完成声纹识别模型的训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京市公安局,其通讯地址为:210004 江苏省南京市秦淮区洪公祠一号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励