昆明理工大学邵玉斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种基于声道滤波和声门激励的语音重构方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114974271B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111650490.6,技术领域涉及:G10L19/16;该发明授权一种基于声道滤波和声门激励的语音重构方法是由邵玉斌;段云;龙华;杜庆治;苏树盟;黄张衡;刘晶设计研发完成,并于2021-12-29向国家知识产权局提交的专利申请。
本一种基于声道滤波和声门激励的语音重构方法在说明书摘要公布了:本发明涉及一种基于声道滤波和声门激励的语音重构方法,属于语言合成技术领域。本发明首先标记音频话音特征起止点,根据检测音频在频域下短时能量的平坦程度,标记音频中的有话段和无话段位置信息,供提取基音频率使用,再提取音频的基音频率,根据倒谱法将声脉冲倒谱和声道响应倒谱分离,提取出音频每一帧的基音频率,其次根据提取出的基音频率,构建模拟声脉的冲激响应,再在音频进行快速傅里叶变换和取对数谱之后,利用离散余弦变换恢复出倒谱数据,最终提取出能量集中的部分,作为模拟的声道响应,并作为重构语音的滤波器数据,最后利用提取出的声脉冲激响应和声道响应重构出语音。本发明在保证语音重构准确率的前提下提高了重构效率。
本发明授权一种基于声道滤波和声门激励的语音重构方法在权利要求书中公布了:1.一种基于声道滤波和声门激励的语音重构方法,其特征在于: Step1:标记音频话音特征起止点,根据检测音频在频域下短时能量的平坦程度,标记音频中的有话段和无话段位置信息,供提取基音频率使用; Step2:提取音频的基音频率,根据倒谱法将声脉冲倒谱和声道响应倒谱分离,提取出音频每一帧的基音频率; Step3:根据提取出的基音频率,构建模拟声门激励; Step4:在音频进行快速傅里叶变换和取对数谱之后,利用离散余弦变换恢复出倒谱数据,最终提取出能量集中的部分,作为模拟的声道响应,并作为重构语音的滤波器数据; Step5:利用提取出的声门激励和声道响应重构出语音; Step3具体为: Step3.1:将基音频率利用三次样条插值法产生使得帧与帧之间的基音周期过渡更加平滑的基音频率序列Fc,长度为帧长乘以总帧数的积; Step3.2:将插值后的基音频率送入VCO压控振荡器,其表达式如式6所示: Step3.3:将VCO输出的数据归一化处理,如式7所示; 式中,归一化范围为75到300Hz频率范围; 将zn变换为矩形波rn,对矩形波rn按照式8进行差分判决,得到声门脉冲激励; Rn=rn-rn-18 Step4具体为: Step4.1:对每一帧的语音数据进行FFT变换,点数为256点,并对前128点取对数谱P1; Step4.2:取对数谱P1进行离散余弦变换得到P2,取出P2中1~25区间的数据进行离散余弦逆变换得到矩阵P3; Step4.3:将P3倒序得到矩阵P4,将P3与P4组重构新的矩阵P5=[P3,P4]; Step4.4:对P5进行傅里叶逆变换后取实数部分得到声道模型全极点滤波器参数矩阵G; Step4.5:取出G中能量最为集中的42个点作为声门滤波参数矩阵G1,输出结果以一个二维数组表示,行表示帧数,列表示每一帧的声道滤波参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650093 云南省昆明市五华区学府路253;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。