中国人民公安大学胡晓光获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民公安大学申请的专利一种基于声学特性的合成语音识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115954016B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211510517.6,技术领域涉及:G10L25/51;该发明授权一种基于声学特性的合成语音识别方法是由胡晓光;周峻林;候晓龙;谢佳宁;杨世欣设计研发完成,并于2022-11-29向国家知识产权局提交的专利申请。
本一种基于声学特性的合成语音识别方法在说明书摘要公布了:本发明提供一种基于声学特性的合成语音识别方法。所述基于声学特性的合成语音识别方法包括以下步骤:S1:连接FFV特征、RMSA特征,随后一同输入至DNN模型中;S2:利用DNN模型对其进行深度表示;S3:将SNS特征依次通过Spec‑Attention模块和MDCN模型进行深度表示;S4:将两者进行连接,输入至全连接层进行二分类输出,最终输出真实或合成。本发明提供的基于声学特性的合成语音识别方法具有能够帮助机器聚焦声学特征中高价值数据,减少与声学特性无关的噪音数据干扰,有效整合了声学特征中图像型数据和时序型数据,在一定程度上利用跨模态数据综合完成了目标任务的优点。
本发明授权一种基于声学特性的合成语音识别方法在权利要求书中公布了:1.一种基于声学特性的合成语音识别方法,其特征在于,包括以下步骤: S1:连接FFV特征、RMSA特征,随后一同输入至DNN模型中; S2:利用DNN模型对其进行深度表示; S3:将SNS特征依次通过Spec-Attention模块和MDCN模型进行深度表示; S4:将步骤S2的深度表示和步骤S3的深度表示进行连接,输入至全连接层进行二分类输出,最终输出真实或合成; 所述Spec-Attention模块首先对输入的SNS特征图像分别按频率和音段方向进行了切割,即按频率切分得到包含谐波形态特点的切分图像,按音段切分得到包含音素频谱分布特点的切分图像,随后对每个切割图像求取空间、通道注意力并求和得到单个注意力特征图,再经过两次连接,最终得到一张特征的注意力权重分布特征图; 所述MDCN模型通过改进稠密神经网络模型中的稠密块,以最大特征映射MFM12操作融入稠密块的每一层卷积之后、过渡层的最后一层,得到最大稠密块与最大过渡层。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民公安大学,其通讯地址为:100038 北京市西城区木樨地南里1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。