安徽艾德未来智能科技有限公司马啸获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽艾德未来智能科技有限公司申请的专利一种用于翻译耳机的声音克隆方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120673742B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510764570.6,技术领域涉及:G10L13/027;该发明授权一种用于翻译耳机的声音克隆方法是由马啸;王松;王超设计研发完成,并于2025-06-10向国家知识产权局提交的专利申请。
本一种用于翻译耳机的声音克隆方法在说明书摘要公布了:本发明公开了一种用于翻译耳机的声音克隆方法,涉及语音信号处理技术领域,包括以下步骤:在翻译耳机启用前的初始化阶段,通过高保真麦克风采集佩戴者在自然语境中的多段语音数据信息,用于全面提取其个性化声纹特征。本发明通过引入隐性高频噪声的识别与动态抑制机制,有效避免了高频干扰对语音频谱结构和声纹特征的破坏。方案结合特征量化分析、深度模型评估与多维频谱抑制手段,构建了识别—判断—响应的闭环控制流程,显著提升了声音克隆模型的建模精度,降低了语音合成中的刺耳啸音与失真风险,增强了翻译耳机语音输出的自然度与一致性。
本发明授权一种用于翻译耳机的声音克隆方法在权利要求书中公布了:1.一种用于翻译耳机的声音克隆方法,其特征在于,包括以下步骤: 在翻译耳机启用前的初始化阶段,通过高保真麦克风采集佩戴者在自然语境中的多段语音数据信息,用于全面提取其个性化声纹特征; 对采集到的语音数据进行预处理,并通过特征工程方法从预处理后的数据中提取出表征语音数据存在隐性高频污染的核心指标,对提取的核心指标进行综合分析,量化当前语音数据的污染程度; 将经过综合分析后的核心指标构建为特征向量,输入至预先训练完成的深度学习模型中,通过模型对当前数据的智能化实时评估,从而判断语音样本中是否存在隐性高频污染; 当识别出采集的语音数据中存在隐性高频噪声污染后,启动高频段动态抑制机制,对语音信号的高频部分执行频谱边界的自适应调整,用于限定参与后续特征建模的频率范围;随后,应用非线性频谱压缩方法对识别出的异常频率成分进行幅度压制,并基于污染频段的动态定位结果构建对应参数的自适应窗口滤波器,对已识别的高频污染区域执行定向滤除处理,抑制异常频率成分的影响; 通过特征工程方法从预处理后的数据中提取出表征语音数据存在隐性高频污染的核心指标,提取的指标包括高频段频谱包络形状对于正常模板的偏离程度和语音的语调走势与高频能量变化的同步性,将高频段频谱包络形状对于正常模板的偏离程度和语音的语调走势与高频能量变化的同步性在检测窗口下进行综合分析分别生成高频谱扭曲指标和语调-高频失配指标,通过高频谱扭曲指标和语调-高频失配指标量化当前语音数据的污染程度; 将高频段频谱包络形状对于正常模板的偏离程度在检测窗口下进行综合分析生成高频谱扭曲指标的具体步骤如下: 在语音信号经过短时傅里叶变换处理后,从频谱图中截取检测窗口对应的高频段频谱,对频段内每一帧信号的频谱包络曲线进行采样并归一化为单位区间[0,1],同时,调用内置的标准语音高频模板包络,对每一频点,计算归一化结构偏离度,计算表达式如下: ,式中,是实际语音样本在频点处的频谱幅度,是实际语音样本在当前检测窗口内高频段所有频点中的最大频谱幅度,是标准语音模板在频点处的频谱幅度值,是参考模板在高频段内的最大幅度值,是实际语音样本在频点处与参考模板频谱的归一化结构偏离; 在获得每一频点的包络偏差后,为增强对剧烈高频异常的响应灵敏度,引入非线性增强机制,将所有频点的差值通过非线性映射函数叠加,生成高频谱扭曲指标,计算表达式如下: ,式中,是高频段所包含的采样频点总数,是自然底数,是偏离增强系数,是高频谱扭曲指标; 将语音的语调走势与高频能量变化的同步性在检测窗口下进行综合分析生成语调-高频失配指标的具体步骤如下: 在检测窗口内,首先提取语音信号的基频序列,采用加权变化率构造归一化语调变化动态曲线,突出语调的微变化趋势;同时从频谱图中提取目标高频段在每一帧的总能量,构建归一化高频能量变化曲线,并进行幅度归整以对齐尺度,公式如下: ,式中,是语音信号在第帧与前一帧之间的基频变化率,计算公式如下:,其中,是语音信号在当前第帧中的基频值,是语音信号在第帧中的基频值,即前一帧的基频,是语调变化响应系数,是语调变化动态曲线,是语音信号在第帧中,高频段的总能量值,是高频能量响应系数,是对数压缩函数,是高频能量变化曲线,表示在第帧的高频能量归一化结果; 基于获取的语调变化动态曲线和高频能量变化曲线,通过对两者在检测窗口内的点对差异进行非线性累计,计算语调-高频失配指标,计算表达式如下: ,式中,是语调-高频失配指标,是检测窗口总帧数,是异步突变放大系数,是偏差幅度增强指数,是自然底数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽艾德未来智能科技有限公司,其通讯地址为:230000 安徽省合肥市高新区蜀麓社区服务中心云飞路5号A座507;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励