中科南京智能技术研究院王啸获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中科南京智能技术研究院申请的专利一种基于时域二值神经网络的语音唤醒方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116597814B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310040914.X,技术领域涉及:G10L15/02;该发明授权一种基于时域二值神经网络的语音唤醒方法及系统是由王啸;李郡;游恒;尚德龙;周玉梅设计研发完成,并于2023-01-11向国家知识产权局提交的专利申请。
本一种基于时域二值神经网络的语音唤醒方法及系统在说明书摘要公布了:本发明公开了一种基于时域二值神经网络的语音唤醒方法及系统,所述方法包括获取待识别音频文件,从而得到待处理语音信号;对待处理语音信号进行声学特征提取,并对其做变维处理,得到变维处理后的声学特征;将变维处理后的声学特征输入预先训练过的时域二值神经网络TBNN模型中,得到关键词和非关键词的概率输出;根据关键词和非关键词的概率输出中最大概率是否为关键词来判断是否唤醒系统,本发明大大降低神经网络分类器参数量与计算量的同时,显著提高唤醒速度并降低语音唤醒系统功耗。
本发明授权一种基于时域二值神经网络的语音唤醒方法及系统在权利要求书中公布了:1.一种基于时域二值神经网络的语音唤醒方法,其特征在于,包括: 获取待识别音频文件,从而得到待处理语音信号; 对待处理语音信号进行声学特征提取,并对其做变维处理,得到变维处理后的声学特征;包括: 对待处理语音信号进行预加重、分帧加窗、快速傅里叶变换、Mel滤波、取对数处理,得到1*40*98的对数梅尔频谱声学特征; 对对数梅尔频谱声学特征进行变维,将其由1*40*98变换为40*1*98,作为时域二值神经网络TBNN模型的输入; 将变维处理后的声学特征输入预先训练过的时域二值神经网络TBNN模型中,得到关键词和非关键词的概率输出;所述时域二值神经网络TBNN模型包括时域卷积层、BN层、ReLU激活函数、6个时域二值卷积块、全局平均池化层、全连接层; 所述时域二值神经网络TBNN模型的训练方法包括: 使用反向传播算法对时域二值神经网络TBNN模型进行训练,用来得到训练完成后的时域二值神经网络TBNN模型作为语音唤醒系统的分类器; 其中,在网络训练过程中,采用周期性梯度近似方法,用来代替Sign函数进行反向传播,具体为: 将Sign函数的反向传播过程跳过,将它的梯度用如下的公式代替: ; 其中,k=0.01,x为权重值或激活值,s为梯度近似值,且s为周期性取值,公式如下: ; 其中,Sstart,n,m为可调节参数,Sstart=1.8,n=8,m=1.2,current_eopch是当前训练的周期数量,cos为余弦函数; s的取值就随cos函数的性质周期性取值,在训练刚开始时,s取值最大,随着训练周期数变化,s取值变小; 根据关键词和非关键词的概率输出中最大概率是否为关键词来判断是否唤醒系统。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科南京智能技术研究院,其通讯地址为:211135 江苏省南京市江宁区创研路266号麒麟人工智能产业园8栋8层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励