三菱电机株式会社堀贵明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉三菱电机株式会社申请的专利长语境端到端语音识别系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116324974B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202180068325.1,技术领域涉及:G10L15/16;该发明授权长语境端到端语音识别系统是由堀贵明;N·莫里茨;堀智织;J·勒鲁克斯设计研发完成,并于2021-04-28向国家知识产权局提交的专利申请。
本长语境端到端语音识别系统在说明书摘要公布了:本发明总体上涉及语音处理,更特别地是,涉及利用长语境信息的端到端自动语音识别ASR。本发明的一些实施方式提供了适合识别长音频记录诸如演讲和交谈语音的端到端ASR的系统和方法。本公开包括利用语境信息的基于变换器的ASR系统,其中变换器同时接受多句话语,并预测最后一句话语的转录。这是以滑动窗口方式按照一句话语移位进行重复,来识别整个记录。此外,当长音频记录包括多个讲话者时,本发明的一些实施方式可以使用仅从由与最后一句话语相同的讲话者所说的先前话语获得的声学和或文本特征。
本发明授权长语境端到端语音识别系统在权利要求书中公布了:1.一种端到端的自动语音识别ASR系统100,该ASR系统100包括: 接口170,该接口被配置为获取包括话语的声学特征序列; 存储器140,该存储器被配置为存储计算机可执行的ASR程序模块、波束搜索解码器202以及语音段更新模块201,所述ASR程序模块包括语境扩展变换器网络,所述语境扩展变换器网络包括编码器网络和解码器网络; 处理器120,所述处理器与所述存储器140连接,被配置为通过执行以下步骤重复对所述话语进行解码: 使用所述声学特征序列和从所述波束搜索解码器202提供的令牌序列来排列语音段和文本段; 通过将所述声学特征序列附加到所述语音段的最后一个来更新所述语音段,并通过将先前话语的识别结果的令牌序列附加到所述文本段的最后一个来更新所述文本段; 接收更新的语音段、更新的文本段和来自所述波束搜索解码器202的部分令牌序列; 基于所述语音段和所述文本段,为所述波束搜索解码器202估计令牌概率,其中,所述语音段中的排除最后一句话语的声学特征序列和所述文本段的所述令牌序列通过所述语境扩展变换器网络被用作语境信息;以及 使用所述波束搜索解码器从估计的令牌概率中找到最可能的令牌序列作为语音识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人三菱电机株式会社,其通讯地址为:日本东京都;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励