北京瀚海京盛技术发展有限公司徐子建获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京瀚海京盛技术发展有限公司申请的专利一种基于人工智能的音响设备音频信号处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120412615B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510613943.X,技术领域涉及:G10L21/0216;该发明授权一种基于人工智能的音响设备音频信号处理方法是由徐子建;高辉设计研发完成,并于2025-05-13向国家知识产权局提交的专利申请。
本一种基于人工智能的音响设备音频信号处理方法在说明书摘要公布了:本发明涉及音频信号处理技术领域,公开一种基于人工智能的音响设备音频信号处理方法,包括如下步骤:步骤S1,获取音频信号,对音频信号进行短时傅里叶变换,转换为时频域表示;步骤S2,对变换后的音频信号进行归一化处理;步骤S3,将归一化后的音频信号输入变分自编码器,提取低维潜在特征向量;步骤S4,将变分自编码器提取的特征向量输入扩散模型,采用逆扩散过程去除噪声。本发明通过基于用户听感特征建模的个性化音频增强技术方案,能根据用户偏好动态调整音频频响特性,实现符合用户听觉习惯的音质输出,相较于现有技术中采用统一音频增强模型的方案,克服个性化需求无法满足、音质调节固定化的局限。
本发明授权一种基于人工智能的音响设备音频信号处理方法在权利要求书中公布了:1.一种基于人工智能的音响设备音频信号处理方法,其特征在于,包括如下步骤: 步骤S1,获取音频信号,对音频信号进行短时傅里叶变换,转换为时频域表示; 步骤S2,对变换后的音频信号进行归一化处理; 步骤S3,将归一化后的音频信号输入通过特殊优化的变分自编码器,提取低维潜在特征向量,其中,所述变分自编码器的训练过程引入流形正则化损失,以约束提取的特征向量在低维空间中的时域连贯性; 所述步骤S3进一步包括: 步骤3.1,构建变分自编码器:变分自编码器通过概率模型对输入数据进行低维编码,先建立编码器网络将归一化后的频谱信号映射到潜在变量Z的分布; 编码器由多组卷积层组成,计算出潜在变量的均值和方差: 其中,μZt为潜在变量Z的均值,为潜在变量Z的方差,fμ和fσ是神经网络映射函数,φ为参数,为归一化后的复数频域信号,f为频率索引,t为时间帧索引; 利用重参数化技巧对潜在变量Z进行采样: Zt=μZt+σZt·β, 其中,Zta为采样得到的潜在变量,β是标准正态分布的噪声项; 步骤3.2,计算变分自编码器目标函数:变分自编码器的目标函数由重建误差和KL散度项组成: 其中,是解码器生成的频谱信号,LVAE为变分自编码器的总损失函数; 是潜在分布与标准正态分布pZ间的KL散度,λ是正则化系数; KL散度进一步展开为: 其中,DKL为KL散度损失,D为潜在空间维度,和为潜在变量在维度d上的均值和方差; 步骤3.3,低维特征空间正则化:引入流形正则化方法,约束编码器学习到的特征在低维空间中的连贯性,采用局部邻域平滑损失: 其中,Nt是时间帧t的邻域,wt′是邻域加权系数,LMR为流形正则化损失; 最终,变分自编码器的优化目标函数变为: total=LVAE+γLMR 其中,Ltotal为最终的优化目标,γ是控制流形正则化强度的超参数; 步骤3.4,通过变分自编码器解码器恢复初步去噪的频谱:使用解码器网络将潜在变量Z重新映射到时频谱空间,恢复初步去噪的音频信号: 其中,g为解码器网络,由参数θ训练,为变分自编码器生成的去噪音频频谱; 将恢复的频谱信号传递至步骤S4进行扩散模型的去噪处理,以进一步去除残余噪声且优化音质; 步骤S4,将具有时域连贯性的低维潜在特征向量输入扩散模型,采用逆扩散过程去除噪声; 步骤S5,对去噪后的音频信号进行逆短时傅里叶变换,恢复时域信号; 步骤S6,对恢复的时域信号应用自适应维纳滤波器进行后处理,以抑制残余噪声; 所述步骤S6进一步包括: 步骤6.1,计算时域音频信号的短时功率谱:在进行自适应滤波前,对步骤S5恢复的时域信号yt进行短时功率谱计算,以分析信号的频率分布和能量特性,短时功率谱定义如下: 其中,Pyfm,tn为第tn帧、第fm频率点上的短时功率谱,M为窗函数的长度,wk为加窗函数,fm为频率索引,tn为时间帧索引,j为虚数单位,π为常数,t为时域的采样点; 步骤6.2,估计噪声功率谱:假设噪声信号nt服从平稳高斯分布,功率谱通过时间平均的方法估计: 其中,为估计的噪声功率谱,λ为平滑因子,Pyfm,tn为短时功率谱; 步骤6.3,计算自适应滤波增益:在获得音频信号的短时功率谱Pyfm,tn和估计的噪声功率谱后,计算Wiener滤波增益Gfm,tn来进行降噪处理: 其中,Gfm,tn为Wiener滤波增益,γ为增益下限,防止滤波器过度抑制音频信号,Pyfm,tn为短时功率谱,为噪声功率谱; 步骤6.4,计算增强后的音频信号:利用计算出的Wiener滤波增益Gfm,tn,对步骤S5输出的音频信号yt进行增强处理,增强后的信号频谱计算如下: 其中,为增强后的信号频谱,Gfm,tn为计算得到的Wiener滤波增益; 后通过逆傅里叶变换将增强后的频谱转换回时域信号: 其中,为增强后的时域音频信号; 步骤6.5,输出增强后的音频信号:通过Wiener滤波增强的时域信号作为步骤S6的输出,且用于后续的播放、存储和进一步处理: 其中,yenhancedt为最终增强后的音频信号; 步骤S7,输出增强后的音频信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京瀚海京盛技术发展有限公司,其通讯地址为:100053 北京市西城区长椿街感化胡同3号院5号楼5302室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励