Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 问问智能信息科技有限公司田锋平获国家专利权

问问智能信息科技有限公司田锋平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉问问智能信息科技有限公司申请的专利语音处理方法、装置、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115497451B

龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211124413.1,技术领域涉及:G10L13/027;该发明授权语音处理方法、装置、电子设备和存储介质是由田锋平;殷昊;陈云琳;叶顺平设计研发完成,并于2022-09-15向国家知识产权局提交的专利申请。

语音处理方法、装置、电子设备和存储介质在说明书摘要公布了:本公开提供了一种语音处理方法、装置、电子设备和存储介质。本公开实施例的语音处理方法包括:获取第一文本和第一说话人的第一真实语音,第一真实语音的内容与第一文本的内容相同;获取指示第一真实语音中噪声特征的第一掩码信息;利用预先训练的声学模型基于第一文本和第一掩码信息生成对应第一文本的第一声学特征;从第一真实语音中提取第一说话人的第二声学特征;根据第一声学特征和第二声学特征更新声学模型的参数。本公开能够在低资源情况下实现了高质量地语音克隆。

本发明授权语音处理方法、装置、电子设备和存储介质在权利要求书中公布了:1.一种语音处理方法,其特征在于,包括: 获取第一文本和第一说话人的第一真实语音,所述第一真实语音的内容与所述第一文本的内容相同; 获取指示所述第一真实语音中噪声特征的第一掩码信息; 利用预先训练的声学模型基于所述第一文本和所述第一掩码信息生成对应所述第一文本的第一声学特征,包括:利用声学模型中的编码器获取对应第一文本的第一文本特征向量;利用声学模型中的解码器根据第一文本特征向量和第一掩码信息生成第一声学特征,包括:利用第一文本特征向量执行解码器中的注意力网络的处理,以获得对应第一文本的第一注意力向量;基于第一注意力向量和前一频谱帧,依次执行解码器中的LSTM、线性投影层的处理,获得当前频谱帧;基于当前频谱帧和第一掩码信息执行解码器中后处理网络的处理,以优化当前频谱帧;在获取到对应第一文本的所有频谱帧后,将所有频谱帧拼接以获得第一声学特征; 从所述第一真实语音中提取所述第一说话人的第二声学特征; 根据所述第一声学特征和第二声学特征更新所述声学模型的参数; 所述声学模型根据多个第二说话人的语料训练得到, 所述多个第二说话人的语料包括:干净的真实语音和含有噪声的真实语音。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人问问智能信息科技有限公司,其通讯地址为:100044 北京市海淀区高梁桥斜街42号院1号楼-1层-101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。