Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学金石获国家专利权

东南大学金石获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利一种语音识别与克隆语义语音传输方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119207421B

龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411323345.0,技术领域涉及:G10L15/26;该发明授权一种语音识别与克隆语义语音传输方法及系统是由金石;刘方彧;姜培文;张静;王闻今设计研发完成,并于2024-09-23向国家知识产权局提交的专利申请。

一种语音识别与克隆语义语音传输方法及系统在说明书摘要公布了:本发明提供了一种语音识别与克隆语义语音传输方法及系统,首先,在发射机,原始语音信号被语音识别模型识别为文本;接着,识别的文本被基于Transformer的编码器编码为文本特征;由说话人编码器从原始语音信号中提取得到音频语义特征;两种浮点形式的语义特征会被量化层量化为OFDM符号并发送到接收机;接收机通过解量化模块将OFDM符号解量化为浮点形式的语义特征,并使用基于Transformer的解码器从文本特征中恢复原始语音信号中的文本;同时,语音克隆模型利用恢复的文本与接收到的音频语义特征完成对原始语音信号的克隆,获得接近原始语音中说话人音色的语音信号。本发明显著减少了传输语音信号所占用的带宽,并极大提高了传输语音信号的质量与用户体验。

本发明授权一种语音识别与克隆语义语音传输方法及系统在权利要求书中公布了:1.一种语音识别与克隆语义语音传输方法,其特征在于,包括以下步骤: 步骤1、利用语音识别模型和说话人编码器分别从原始语音信号中分别提取出与语音内容相关的文本以及与说话人音色相关的音频语义特征FA; 步骤2、将数据集中所有的原始语音都识别为文本,用以训练基于Transformer结构的文本编码器TEen和解码器TEde;在训练完成后,文本编码器被放置在发射机,以完成将从原始语音信号S中识别的文本转化为文本语义特征FT的功能; 步骤3、使用量化模块将文本语义特征FT和音频语义特征FA量化为OFDM符号X,并经过无线信道发送到接收机;在接收机处,解量化模块将接收到的OFDM符号解量化为浮点形式的语义特征和 步骤4、基于Transformer的文本解码器TEde从接收到的文本语义特征中恢复文本恢复的文本与接收到的音频语义特征一起被送入预训练的语音克隆模型中,恢复出文本内容与说话人音色都接近原始语音信号的语音。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211189 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。