北京百度网讯科技有限公司赵镜儒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利语音识别模型训练、测试、语音识别方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118553234B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410726281.2,技术领域涉及:G10L15/06;该发明授权语音识别模型训练、测试、语音识别方法和装置是由赵镜儒;石东升设计研发完成,并于2024-06-05向国家知识产权局提交的专利申请。
本语音识别模型训练、测试、语音识别方法和装置在说明书摘要公布了:本公开提供了一种语音识别模型训练方法和装置,涉及人工智能技术领域,具体涉及语音识别、深度学习、大模型等技术领域,可应用于人工智能的内容生成等场景。具体实现方案为:获取语音样本集,语音样本集包括至少一个语音样本,语音样本包括:音频特征序列和初始词单元序列;获取初始的语音识别模型,语音识别模型用于表征音频特征序列与预测词单元序列之间的对应关系;采用表征语种的预测词单元替换语音样本集中初始词单元序列中的语种词单元,得到训练样本集,预测词单元为将从语音样本集中选取的语音样本输入语音识别模型,得到的预测词单元序列中的预测词单元;基于训练样本集,训练语音识别模型,得到训练后的语音识别模型。
本发明授权语音识别模型训练、测试、语音识别方法和装置在权利要求书中公布了:1.一种语音识别模型训练方法,所述方法包括: 获取语音样本集,所述语音样本集包括至少一个语音样本,所述语音样本包括:音频特征序列和初始词单元序列; 获取初始的语音识别模型,所述语音识别模型用于表征音频特征序列与预测词单元序列之间的对应关系,所述语音识别模型包括:初始的识别子模型、与所述初始的识别子模型连接的关键词模块; 采用表征语种的预测词单元替换所述语音样本集中初始词单元序列中的语种词单元,得到训练样本集,所述预测词单元为将从所述语音样本集中选取的语音样本输入所述语音识别模型,得到的预测词单元序列中的预测词单元; 基于所述训练样本集,训练所述初始的识别子模型,得到训练后的识别子模型; 固定所述训练后的识别子模型的参数; 将训练样本集中的训练样本输入所述训练后的识别子模型,得到所述训练后的识别子模型输出的第一概率分布和所述关键词模块输出的第二概率分布; 基于所述第一概率分布和所述第二概率分布,计算训练样本中初始词单元的损失值; 基于所述损失值,得到训练后的关键词模块; 将所述训练后的识别子模型和所述训练后的关键词模块作为训练后的语音识别模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。