当前位置 : 首页 > 专利喜报 > 东南大学程向红获国家专利权

东南大学程向红获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉东南大学申请的专利基于选择性状态空间模型Mamba的语音增强方法及系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN119993176B 。

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202510369680.2，技术领域涉及：G10L21/02；该发明授权基于选择性状态空间模型Mamba的语音增强方法及系统是由程向红;杨铭扬设计研发完成，并于2025-03-27向国家知识产权局提交的专利申请。

本基于选择性状态空间模型Mamba的语音增强方法及系统在说明书摘要公布了：本发明公开了基于选择性状态空间模型Mamba的语音增强方法及系统，对失真语音进行短时傅立叶变换得到时频域信号，将时频域信号的幅值、实部和虚部拼接为3个通道的信号作为输入信号，输入信号经生成器网络编码器的第一个卷积块从3个通道扩展为多个通道，通过编码器的扩张密集卷积层提取不同分辨率特征并增加感受野，利用编码器最后一个卷积块将信号的频率维度降为原来的12以减少计算复杂度，经编码器扩展后的信号通过N个TF‑mamba块模拟不同分辨率下语音信号的前向和后向依赖关系以捕获长序列语音信号的局部和全局特征，实现特征增强，再分别通过复数解码器和掩码解码器预测增强信号幅值和相位得到去噪去混响后的增强语音。

本发明授权基于选择性状态空间模型Mamba的语音增强方法及系统在权利要求书中公布了：1.基于选择性状态空间模型Mamba的语音增强方法，其特征在于，至少包括如下步骤： S1、数据预处理：对输入的失真语音信号进行预处理，通过短时傅立叶变换得到时频域信号，L表示语音时域长度；将时频域信号的幅值、实部和虚部拼接为输入信号其中，B表示批量大小，T是帧数，F是频点，3是通道数； S2、信号扩展：将步骤S1变换得到的时频域信号经编码器进行维度扩展，从3个通道扩展为C个通道；所述编码器包括两个卷积块和一个扩张密集卷积层，其中，第一个卷积块用于将输入信号的通道维度从3扩展为C，形成信号扩展后的信号通过扩张密集卷积层提取不同分辨率特征并增加感受野得到第二个卷积块用于将通过扩张密集卷积层后的信号Y″stft的频率F降采样为得到扩展后信号 S3、特征增强：通过N个TF-mamba块，对步骤S2扩展后的信号进行特征增强，模拟不同分辨率下语音信号的前向和后向依赖关系，得到特征增强后的信号所述TF-mamba块由TimeMamba块和FrequencyMamba块组成，每个Mamba块采用了双向SSM模式，对于输入信号通过前向Mamba和后向Mamba并行处理； S4、语音信号增强：将步骤S3的信号分别通过掩码解码器和复数解码器进行幅值和相位处理，得到预测幅值与相位，将其组合后得到预测频谱信号，对预测频谱信号作逆幂次压缩和逆短时傅立叶变换ISTFT后，得到增强语音信号； S5、增强语音判别：将步骤S4得到的增强语音信号与干净语音信号通过度量判别器进行判别，对判别器进行训练后更新生成器和判别器的梯度；将步骤S2的输入信号Yin输入更新梯度后的生成器，重复步骤S2-S4，得到新的增强语音，通过梯度更新后的判别器进行增强语音判别，重复步骤S2-S5进行生成器网络和判别器的更新，实现语音增强。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人东南大学，其通讯地址为：211189 江苏省南京市江宁区东南大学路2号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

东南大学程向红获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务