当前位置 : 首页 > 专利喜报 > 森丽康科技(北京)有限公司曲元震获国家专利权

森丽康科技(北京)有限公司曲元震获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉森丽康科技(北京)有限公司申请的专利一种基于声纹识别的自适应VAD参数调节方法及系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN120048268B 。

龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202510511744.8，技术领域涉及：G10L17/06；该发明授权一种基于声纹识别的自适应VAD参数调节方法及系统是由曲元震设计研发完成，并于2025-04-23向国家知识产权局提交的专利申请。

本一种基于声纹识别的自适应VAD参数调节方法及系统在说明书摘要公布了：本发明涉及数据处理技术领域，公开了一种基于声纹识别的自适应VAD参数调节方法及系统，其方法包括：通过音频采集设备获取音频信号，对音频信号进行预处理并提取声纹特征，将声纹特征映射至用户声纹模型，将当前用户声纹模型与声纹库中的储存模型进行比对，判断是否为已注册用户；根据是否为已注册用户确定VAD参数；当判断为非注册用户时，通过静音段与语音段的特征波动检测对VAD参数进行实时调整；将调整后的VAD参数存储至声纹库中。本发明的VAD参数调节方法能够自适应不同用户特征与环境变化，在复杂场景下表现出更强的鲁棒性和适应性。

本发明授权一种基于声纹识别的自适应VAD参数调节方法及系统在权利要求书中公布了：1.一种基于声纹识别的自适应VAD参数调节方法，其特征在于，包括：通过音频采集设备获取音频信号，对音频信号进行预处理并提取声纹特征，将所述声纹特征映射至用户声纹模型，将当前用户声纹模型与声纹库中的储存模型进行比对，判断是否为已注册用户；根据是否为已注册用户确定VAD参数，当判断为非注册用户时，通过静音段与语音段的特征波动检测对所述VAD参数进行实时调整；将调整后的VAD参数存储至所述声纹库中；其中，将当前用户声纹模型与声纹库中的储存模型进行比对，判断是否为已注册用户时，包括：获取所述当前用户声纹模型与声纹库中各个储存模型的MFCC值、LPCC值与基频并进行比对，计算相似度，选取最大相似度，将所述最大相似度与相似阈值进行比对；当所述最大相似度大于或等于相似阈值时，判断当前用户模型为已注册用户，当所述最大相似度小于相似阈值时，判断当前用户模型不是已注册用户；所述相似度满足以下关系：；其中，为相似度，为当前用户声纹模型的第j个声纹特征，为储存模型的第j个声纹特征；为声纹特征数量，=3，当j=1时，对应MFCC值；当j=2时，对应LPCC值；当j=3时，对应基频；当判断为已注册用户时，调取声纹库中最大相似度对应的储存模型的VAD参数；当判断不是已注册用户时，将预处理后的音频信号根据能量值划分为静音段与语音段，根据静音段与语音段特征波动检测对所述VAD参数进行实时调整；当判断为非注册用户时，当根据能量值划分为静音段与语音段时，包括：计算每一帧音频信号的能量值，通过对比能量值与能量阈值判断划分为静音段或语音段，所述能量值通过以下关系获取：；；其中，为第m帧的能量值，为第m帧的第k个采样点，N为每帧的采样点数量；N≥2，为能量阈值；当大于或等于判断为语音段，反之则为静音段；当对音频信号进行预处理时，包括： S1：计算音频信号的平均值，并从每个采样点中减去音频信号的平均值； S2：根据以下关系进行预加重处理：； S3：以25ms将音频信号切分为帧，设置帧移为10ms； S4：基于Hamming窗对音频信号进行加窗，对每个采样点与Hamming窗函数相乘；其中，与分别为预加重处理前与预加重处理后的第n个采样点的音频信号，为预加重系数，0.9＜≤1，为预加重处理前的第n-1个采样点的音频信号；根据静音段的特征波动检测对所述VAD参数进行实时调整，包括：所述VAD参数包括过零率检测门限、信噪比门限、挂起时间与持续时间；所述过零率检测门限、信噪比门限、挂起时间与持续时间通过以下关系进行调整：；；；；；；；其中，为调整后的过零率检测门限，为初始检测门限，为频谱波动率，为第m帧的第h维MFCC值，为第m-1帧的第h维MFCC值，K表示MFCC值的维度，K取13或20，为常数，=10-6，为信噪比，为所有语音段的平均能量值，为所有静音段的平均能量值，为调整后的信噪比门限，为初始信噪比门限，为调整后的挂起时间，为初始挂起时间，为调整后的持续时间，为初始持续时间，为第m帧的能量短时能量波动率，为第m-1帧的能量短时能量波动率，为频谱波动率调节系数，为频谱平稳率调节系数，为第一信噪比调整系数，为第二信噪比调整系数，为能量波动影响系数，为频谱波动影响系数，、、与的取值范围均为[0.05,0.2]；还包括：记录储存模型存入声纹库中的时长，当所述时长满足大于或等于预先设定的最大时长时，对所述储存模型进行删除。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人森丽康科技(北京)有限公司，其通讯地址为：100070 北京市丰台区南四环西路128号院3号楼21层2515-1；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

森丽康科技(北京)有限公司曲元震获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务