深圳市大数据研究院王帅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市大数据研究院申请的专利语音处理方法、装置、存储介质及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119479683B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411415239.5,技术领域涉及:G10L25/03;该发明授权语音处理方法、装置、存储介质及计算机设备是由王帅;王午芃;林静如;潘泽煦;李海洲设计研发完成,并于2024-10-11向国家知识产权局提交的专利申请。
本语音处理方法、装置、存储介质及计算机设备在说明书摘要公布了:本申请实施例提供一种语音处理方法、装置、存储介质及计算机设备,包括:获取至少两个音源混合后的融合语音数据并提取融合语音特征。接着,将融合语音特征输入训练后的特点感知器确定语音特点掩码,基于此确定语音特点表征。再通过特征感知器确定语音特征掩码,进而确定语音特征。最后将语音特征输入训练后的解码器,解码出每个音源对应的语音数据。通过特点感知器感知语音特点进行盲源分离,降低分离语音与原始语音差异,降低分离出的语音与原始语音的差异,提高一致性,进而提升语音处理的准确性。
本发明授权语音处理方法、装置、存储介质及计算机设备在权利要求书中公布了:1.一种语音处理方法,其特征在于,包括: 获取融合语音数据,对所述融合语音数据进行特征提取,得到融合语音特征,所述融合语音数据包括至少两个音源混合后产生的语音数据; 获取第一样本融合语音数据的第一样本融合语音特征,以及所述第一样本融合语音数据中包括的每个第一音源的第一样本真实语音数据; 将所述第一样本融合语音特征输入至待训练的特点感知器,确定每个第一音源对应语音数据的第一样本语音特点掩码; 通过每个所述第一样本语音特点掩码以及待训练的预测器,确定每个第一音源对应语音数据的第一预测特点; 将每个所述第一样本真实语音数据输入至训练后的特点提取模型,提取出每个第一音源对应语音数据的第一真实特点; 根据每个第一音源的第一预测特点以及对应的第一真实特点,确定第一损失值; 当所述第一损失值大于第一预设损失值时,根据所述第一损失值调整所述待训练的特点感知器以及所述待训练的预测器的网络参数,并返回执行将所述第一样本融合语音特征输入至待训练的特点感知器,确定每个第一音源对应语音数据的第一样本语音特点掩码的步骤,直至第一损失值小于或等于所述第一预设损失值为止,得到初步训练后的特点感知器以及训练后的预测器; 将所述融合语音特征输入至训练后的特点感知器,确定每个音源对应语音数据的语音特点掩码; 基于每个所述语音特点掩码从所述融合语音特征中,确定出每个音源对应语音数据的语音特点表征; 获取第二样本融合语音数据的第二样本融合语音特征,以及所述第二样本融合语音数据中包括的每个第二音源的第二样本真实语音数据; 将所述第二样本融合语音特征输入至初步训练后的特点感知器,确定每个第二音源对应语音数据的第二样本语音特点掩码; 基于每个所述第二样本语音特点掩码从所述第二样本融合语音特征中,确定每个第二音源对应语音数据的第二样本语音特点表征; 将每个所述第二样本语音特点表征输入至待训练的特征感知器,确定每个第二音源对应语音数据的样本语音特征掩码; 基于每个所述样本语音特征掩码从所述第二样本融合语音特征中,确定每个第二音源对应语音数据的样本语音特征; 将每个所述样本语音特征输入至待训练的解码器,解码出每个第二音源对应的第二样本预测语音数据; 基于每个第二音源的第二样本预测语音数据以及对应的第二样本真实语音数据,确定第二损失值; 当所述第二损失值大于第二预设损失值时,根据所述第二损失值调整所述待训练的特征感知器的网络参数,并返回执行将所述第二样本融合语音特征输入至初步训练后的特点感知器,确定每个第二音源对应语音数据的第二样本语音特点掩码的步骤,直至第二损失值小于或等于所述第二预设损失值为止,得到训练后的特点感知器、训练后的特征感知器以及训练后的解码器; 将每个所述语音特点表征输入至训练后的特征感知器,确定每个音源对应语音数据的语音特征掩码; 基于每个所述语音特征掩码从所述融合语音特征中,确定每个音源对应语音数据的语音特征; 将每个所述语音特征输入至训练后的解码器,解码出每个所述音源对应的语音数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市大数据研究院,其通讯地址为:518172 广东省深圳市龙岗区龙城街道龙翔大道2001号道远楼225室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励