上海科技大学郁程获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海科技大学申请的专利跨语句条件相干的语音编辑方法、系统及终端获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116189653B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310146999.X,技术领域涉及:G10L13/033;该发明授权跨语句条件相干的语音编辑方法、系统及终端是由郁程;李阳;祖伟钦;孙芳蕾;田政;汪军设计研发完成,并于2023-02-21向国家知识产权局提交的专利申请。
本跨语句条件相干的语音编辑方法、系统及终端在说明书摘要公布了:本发明的跨语句条件相干的语音编辑方法、系统及终端,通过具有将语音输入信息中的音频特征和上下文语义信息作为条件输入的变分自动编码器以及解码器的语音编辑模型,根据待编辑的语音信息获得对应的编辑梅尔谱图,能够高保真地重建原始波形的未修改区域。通过使用整体推断而非部分推断,拼接导致的衔接处不连贯得以被彻底避免。此外,与现有的部分推理编辑系统相比,本发明的整体推理方法不会消耗额外的资源。
本发明授权跨语句条件相干的语音编辑方法、系统及终端在权利要求书中公布了:1.一种跨语句条件相干的语音编辑方法,其特征在于,所述方法包括: 获取待编辑的语音输入信息;其中,所述语音输入信息包括:初始梅尔谱图、当前转录文本语句及其前后的相同目标个数的文本语句; 基于掩码训练的语音编辑模型,根据待编辑的语音信息获得对应的编辑梅尔谱图; 其中,所述语音编辑模型包括:将语音输入信息中的音频特征和上下文语义信息作为条件输入的变分自动编码器以及解码器; 所述变分自动编码器包括: 音素转换模块,用于将输入的当前转录文本语句转换为音素序列信息; 语境信息捕获模块,用于对由当前转录文本语句及其前后的相同目标个数的文本语句重组的各语句对分别捕获语境信息,生成对应各语句对的BERT嵌入信息; 上下文嵌入模块,连接所述音素转换模块以及语境信息捕获模块,用于基于所述音素序列信息、目标说话人特征信息以及各BERT嵌入信息获得跨语句表征输出数据以及音素持续时间; 编辑模块,连接所述上下文嵌入模块,用于基于所述初始梅尔谱图、跨语句表征输出数据以及音素持续时间生成对应的编辑语音数据并输出,以供所述解码器对其解码获得对应的编辑梅尔谱图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海科技大学,其通讯地址为:201210 上海市浦东新区华夏中路393号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。