Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 数据空间研究院余海阳获国家专利权

数据空间研究院余海阳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉数据空间研究院申请的专利基于音素对比能量学习的方言语音合成方法、终端及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120833778B

龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511316462.9,技术领域涉及:G10L13/08;该发明授权基于音素对比能量学习的方言语音合成方法、终端及介质是由余海阳;张佳佳;曹燕;胡家武;潘李伟;魏凌波设计研发完成,并于2025-09-16向国家知识产权局提交的专利申请。

基于音素对比能量学习的方言语音合成方法、终端及介质在说明书摘要公布了:本发明涉及语音合成技术领域,公开了基于音素对比能量学习的方言语音合成方法、终端及介质。该语音合成方法首先获取标准语言文本,并将其转换为标准语言音素序列;基于方言的音频样本构建方言音素集合;然后利用训练完成的音素对比能量模型,分别计算每个标准语言音素与各方言音素之间的能量差异,并为每个标准语言音素选取能量差距最小的方言音素作为映射结果;再根据映射结果生成与标准语言音素序列长度一致的方言音素序列;最后将方言音素序列转换为目标方言语音波形能量差异用于表征音素特征之间的相似度,基于音素在特征空间的距离、发音方式特征和发音部位特征联合计算获得。本发明能在低资源条件下实现高效、准确的方言语音合成。

本发明授权基于音素对比能量学习的方言语音合成方法、终端及介质在权利要求书中公布了:1.基于音素对比能量学习的方言语音合成方法,其特征在于,包括: 获取标准语言文本,并将其转换为标准语言音素序列,该序列包括文本中所有标准语言音素的特征; 基于方言的音频样本构建方言音素集合,该集合包括所有方言音素的特征; 利用训练完成的音素对比能量模型,分别计算每个标准语言音素与各方言音素之间的能量差异,并为每个标准语言音素选取能量差距最小的方言音素作为映射结果; 根据映射结果生成与所述标准语言音素序列长度一致的方言音素序列; 将方言音素序列转换为目标方言语音波形; 其中,所述能量差异用于表征音素特征之间的相似度,基于音素在特征空间的距离、发音方式特征和发音部位特征联合计算获得; 所述音素对比能量模型通过三元组对比学习策略进行训练; 其中,训练集包括若干个三元组,每个三元组由锚点、正样本和负样本组成;锚点为标准语言音素特征;对于每个锚点,其正样本为语义对应的方言音素特征,负样本为语义不对应且与正样本属于不同方言类别的方言音素特征; 在训练所述音素对比能量模型的过程中,采用以下损失函数: 式中,为总损失;为对比损失;为重构损失,为正则损失,和为相应的损失权重; 其中,对比损失的表达式如下: 式中,max{·,·}表示取最大值;为锚点的音素特征,为正样本的音素特征,为负样本的音素特征;为音素特征和之间的能量差异;为音素特征和之间的能量差异;为边界参数,用于控制正负样本对之间的能量差异; 重构损失的表达式如下: 式中,|·|2为L2范数;为声学解码器;为方言音素集合中的任意一个音素i’的特征,为对应的音频片段; 正则损失的表达式如下: 。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人数据空间研究院,其通讯地址为:230000 安徽省合肥市高新区柏堰科技园创新大道288号工投高新智谷B区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。