成都理工大学邓飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都理工大学申请的专利一种基于SASFV聚合模型的说话人确认方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120766685B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511282711.7,技术领域涉及:G10L17/02;该发明授权一种基于SASFV聚合模型的说话人确认方法是由邓飞;于琳;庞亮;龚子珊设计研发完成,并于2025-09-09向国家知识产权局提交的专利申请。
本一种基于SASFV聚合模型的说话人确认方法在说明书摘要公布了:本发明公开了一种基于SASFV聚合模型的说话人确认方法,涉及语音识别领域,该方法通过短时傅里叶变换和梅尔滤波提取对数梅尔谱图,利用ERes2Net网络生成帧级特征,并引入SASFV聚合模型结合FisherVector变量、自注意力机制和统计方法生成固定长度的说话人级特征,最终通过余弦距离判定说话人身份。本发明解决了现有技术在短语音任务中无法有效表征和聚合特征的问题,显著提升了说话人识别系统的准确率、鲁棒性和性能。
本发明授权一种基于SASFV聚合模型的说话人确认方法在权利要求书中公布了:1.一种基于SASFV聚合模型的说话人确认方法,其特征在于,包括以下步骤: S1:从原始音频信号中提取帧级特征; S2:利用SASFV聚合模型对所述帧级特征进行聚合得到聚合帧级特征; S21:根据一维高斯分布概率密度函数进行计算,其概率密度表示为: 其中,高斯混合模型中第k个高斯模型的参数集,其中、、分别为混合权重、均值向量和协方差矩阵,表示标准差向量; S22:根据的后验概率表示为: 令,,并且,则后验概率改写为: S23:在梯度计算过程中,将自注意力机制与统计方法相结合,生成SASFV中第k个高斯分量的均值向量和标准差向量计算如下: 其中、、分别为均值向量mean的查询、键、值;,和分别是线性变换的权重;表示通过统计方法得到的键;表示隐藏特征的维数;、、分别为标准差向量std的查询、键、值的标准差;、、为线性变换的权重,⊙为逐元素乘法; S24:根据均值向量、标准差向量和后验概率得到SASFV均值向量的梯度向量以及SASFV标准差向量的梯度向量,具体如下: S25:将SASFV所有、分量的梯度连接起来形成梯度向量,表示如下: S26:对所有特征的梯度进行平均,得到SASFV的: 其中,梯度向量; S3:得到聚合帧级特征通过交叉熵损失函数作为训练目标函数,通过更新参数最小化损失,得到网络模型; S4:使用训练好的网络模型提取音频特征并与数据库中的特征向量进行余弦距离计算,并与阈值比较,最终识别出说话人身份。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都理工大学,其通讯地址为:610000 四川省成都市成华区二仙桥东三路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励