思必驰科技股份有限公司朱冰清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉思必驰科技股份有限公司申请的专利长语音识别模型训练方法及电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115798460B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211573275.5,技术领域涉及:G10L15/04;该发明授权长语音识别模型训练方法及电子设备和存储介质是由朱冰清;唐健;薛少飞设计研发完成,并于2022-12-08向国家知识产权局提交的专利申请。
本长语音识别模型训练方法及电子设备和存储介质在说明书摘要公布了:本发明公开一种长语音识别模型训练方法及电子设备和存储介质,其中方法包括:获取构造完成的长语音训练数据,其中,所述长语音训练数据包括提取的声学输入特征、用于训练端点检测模型的帧级别分类标签和用于训练语音识别模型的文本标签;利用所述长语音训练数据对所述端点检测模型和所述语音识别模型进行联合训练。本发明实施例通过获取构造完成的长语音训练数据来对端点检测模型和语音识别模型进行联合训练,在优化端点检测模型的基础上引入识别模型提供的相关信息辅助端点检测模型的训练优化,实现一套完整的联合优化方法,有效的提升了长语音这个链路的识别性能。
本发明授权长语音识别模型训练方法及电子设备和存储介质在权利要求书中公布了:1.一种长语音识别模型训练方法,包括: 获取构造完成的长语音训练数据,其中,所述长语音训练数据包括提取的声学输入特征、用于训练端点检测模型的帧级别分类标签和用于训练语音识别模型的文本标签; 利用所述长语音训练数据对所述端点检测模型和所述语音识别模型进行联合训练; 其中,所述长语音训练数为模拟真实长语音的构造,利用有效和非有效语音片段拼接一定长度的待训练语音数据,使所述长语音训练数据在构造上更贴近所述真实长语音未被切分前的状态,进而端点检测模型能够学习到更丰富的数据分布,提升其准确性和鲁棒性; 其中,所述利用所述长语音训练数据对所述端点检测模型和所述语音识别模型进行联合训练包括:利用声学嵌入特征提取模型从所述长语音训练数据中提取声学嵌入信息;将所述声学嵌入信息与所述声学输入特征进行拼接并输入至所述端点检测模型,至少结合所述帧级别分类标签对所述端点检测模型进行训练;获取所述端点检测模型的输出概率分布,对所述输出概率分布和所述声学输入特征进行处理并输入至所述语音识别模型,至少结合所述文本标签对所述语音识别模型进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人思必驰科技股份有限公司,其通讯地址为:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励