浙江大学;浙江大学金华研究院裴志诚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学;浙江大学金华研究院申请的专利一种基于时频特征融合的智能声音信号感知方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120895051B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511437990.X,技术领域涉及:G10L25/03;该发明授权一种基于时频特征融合的智能声音信号感知方法及系统是由裴志诚;厉江鹏;郑斌;赵纪伟;鲁焕;朱蓉蓉;张婷;陈红胜设计研发完成,并于2025-10-10向国家知识产权局提交的专利申请。
本一种基于时频特征融合的智能声音信号感知方法及系统在说明书摘要公布了:本发明公开了一种基于时频特征融合的智能声音信号感知方法及系统,涉及智能声音信号处理技术领域,包括:获取原始音频信号;对所述原始音频信号进行短时傅里叶变换,获取复数频谱特征;将所述复数频谱特征输入至复数神经网络中进行处理,提取频域深度特征;采用一维卷积神经网络对所述原始音频信号进行处理,提取时域深度特征;将所述频域深度特征与所述时域深度特征在通道维度进行拼接融合,得到时频融合特征;将所述时频融合特征输入至全连接层分类器中,得到最终的音频场景识别结果。本发明通过设计时域与频域并行处理的双分支网络架构,有效融合了时域波形信息与频域的幅值及相位信息,在端到端的训练场景中,显著提升了音频识别的准确率。
本发明授权一种基于时频特征融合的智能声音信号感知方法及系统在权利要求书中公布了:1.一种基于时频特征融合的智能声音信号感知方法,其特征在于,包括:获取原始音频信号; 并行地建立时域特征提取分支和频域特征提取分支; 分别对所述原始音频信号进行频域特征提取和时域特征提取,得到频域深度特征和时域深度特征; 其中,对所述原始音频信号进行频域特征提取,包括: 对所述原始音频信号进行短时傅里叶变换,获取复数频谱特征; 将所述复数频谱特征输入至复数神经网络中进行处理,提取频域深度特征; 对所述原始音频信号进行时域特征提取,包括: 采用一维卷积神经网络对所述原始音频信号进行处理,提取时域深度特征; 将所述频域深度特征与所述时域深度特征在通道维度进行拼接融合,得到时频融合特征; 将所述时频融合特征输入至全连接层分类器中,得到最终的音频场景识别结果; 所述复数神经网络由多个复数残差模块堆叠而成,所述复数残差模块包括依次连接的复数卷积层、复数批归一化层、复数激活函数和复数注意力模块; 将所述复数频谱特征输入至复数卷积层进行处理,表示为: ; 其中,和代表复数卷积核的实部和虚部;和分别代表第个复数残差模块输出的实部和虚部的特征,和分别表示和输入复数卷积层输出的实部和虚部特征; 所述复数批归一化层对和进行归一化处理,得到归一化特征和; 所述复数激活函数计算归一化特征的模和缩放因子,并将计算得到的缩放因子同时作用于输入特征的实部和虚部,得到: ; ; 其中,和表示和经过复数卷积层、复数归一化层和复数激活函数后的实部和虚部特征; 所述复数注意力模块根据和的模得到复数通道权重: ; ; 其中,是为第个复数残差模块的输入特征图动态生成的、针对每个通道的复数权重;和为实部和虚部;和表示和经过复数卷积层、复数归一化层、复数激活层和复数注意力层后的实部和虚部特征; 将输出特征分别与残差项相加,并进行池化操作,得到第个模块处理后的复数特征图; 将最后一个复数残差模块输出的复数特征图经过全局平均池化后得到实部和虚部向量和; 对空间维度进行处理,得到展平后的实部和虚部向量和; 将展平后的实部和虚部向量在通道维度上进行拼接,将拼接后的特征向量输入到全连接层得到最终的频域深度特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学;浙江大学金华研究院,其通讯地址为:310027 浙江省杭州市西湖区浙大路38号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励