阿里巴巴达摩院(杭州)科技有限公司张冲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴达摩院(杭州)科技有限公司申请的专利语音识别方法和模型训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115954001B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310099505.7,技术领域涉及:G10L15/02;该发明授权语音识别方法和模型训练方法是由张冲;黄殿文;叶家祺;马煜坤;倪崇嘉;阮成孝;马斌设计研发完成,并于2023-01-30向国家知识产权局提交的专利申请。
本语音识别方法和模型训练方法在说明书摘要公布了:本申请公开了一种语音识别方法和模型训练方法。其中,该方法包括:获取对第一对象进行语音采集所得到的语音数据,其中,语音数据包含目标语言类型的语音内容;利用语音识别模型对语音数据进行特征提取,得到语音数据的声学特征;基于声学特征的全局信息和局部信息,将声学特征输入至语音识别模型进行语音识别,得到语音内容的目标识别结果,其中,语音识别模型是利用第一语音样本和第二语音样本进行半监督和自监督学习得到的,第一语音样本包含多种预设语言类型的语音样本,且未包含标注信息,第二语音样本包含目标语言类型的语言样本和标注信息。本申请解决了相关技术中语音识别模型的识别准确率较低的技术问题。
本发明授权语音识别方法和模型训练方法在权利要求书中公布了:1.一种语音识别方法,其特征在于,包括: 获取对第一对象进行语音采集所得到的语音数据,其中,所述语音数据包含目标语言类型的语音内容,所述目标语言类型是多种预设语言类型中的任意一种类型; 利用语音识别模型对所述语音数据进行特征提取,得到所述语音数据的声学特征; 基于所述声学特征的全局信息和局部信息,将所述声学特征输入至所述语音识别模型进行语音识别,得到所述语音内容的目标识别结果,其中,所述语音识别模型是利用第一语音样本和第二语音样本进行半监督和自监督学习得到的,所述第一语音样本包含所述多种预设语言类型的语音样本,且未包含标注信息,所述第二语音样本包含所述目标语言类型的语言样本和标注信息; 其中,所述语音识别模型的模型参数是由目标损失值进行调整,所述目标损失值基于自监督损失值和半监督损失值得到,所述半监督损失值利用第一语音样本和增强样本集合对所述语音识别模型进行半监督学习得到,所述增强样本集合对所述第一语音样本进行多次数据增强得到。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴达摩院(杭州)科技有限公司,其通讯地址为:310023 浙江省杭州市余杭区五常街道文一西路969号3幢5层516室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励