Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 沪渝人工智能研究院李卓烜获国家专利权

沪渝人工智能研究院李卓烜获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉沪渝人工智能研究院申请的专利一种基于大模型的实时英文语音识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117373434B

龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311455552.7,技术领域涉及:G10L15/00;该发明授权一种基于大模型的实时英文语音识别方法及系统是由李卓烜;张小群;陈玺设计研发完成,并于2023-11-03向国家知识产权局提交的专利申请。

一种基于大模型的实时英文语音识别方法及系统在说明书摘要公布了:本发明涉及语音识别技术,特别涉及一种基于大模型的实时英文语音识别方法及系统,方法包括:将当前收到的长度为T的音频片段与历史音频片段进行拼接并输入语音识别模型;若语音识别的结果中出现结束符,则利用当前识别结果替换上一次识别结果;使用动态线性规划算法,计算当前输入语音识别模型的音频每个单词的时间戳,以结束符前面一个单词的结束时间作为起始位置,舍弃起始位置之前的音频同时舍弃结束符之后所有识别结果并将其作为历史音频片段,将结束符及之前的识别结果标记为可以拼接状态并反馈给前端;若未出现结束符,则将当前识别结果拼接到上一次识别结果后面;本发明在满足实时性的同时,提高了语音识别准确率。

本发明授权一种基于大模型的实时英文语音识别方法及系统在权利要求书中公布了:1.一种基于大模型的实时英文语音识别方法,其特征在于,采用seq2seq架构的大模型作为识别模型,seq2seq架构包括编码器和解码器,利用识别模型进行语音识别的过程具体包括以下步骤: 100、前端以固定间隔T向语音识别模型发送音频,每段音频长度为T; 101、将当前收到的长度为T的音频片段与历史音频片段进行拼接并输入语音识别模型; 102、若语音识别的结果中未出现结束符,则执行步骤103,否则执行步骤105; 103、判断长度为T的音频片段与历史音频片段进行拼接后的音频长度是否大于历史音频片段阈值,若大于根据识别结果最后一个单词的时间戳获取该单词的开始时间,保留该单词开始时间到拼接后的音频末尾的这一段音频作为历史音频片段,并将本次识别结果标记为“拼接”,执行步骤107; 104、否则直接将长度为T的音频片段与历史音频片段进行拼接后的音频作为历史音频片段,并将本次识别结果标记为“可以替换”; 105、计算结束符出现的前一个单词的时间戳,根据时间戳获取该单词的结束时间,保留该单词结束时间到拼接后的音频的末尾这一段音频作为历史音频片段; 106、舍弃结束符出现后的识别结果,并将本次识别结果标记为“拼接”; 107、前端收到当前识结果及其标记,若上一次标记为“可以替换”,则利用当前识别结果替换到上一次识别结果;若上一次标记为“拼接”,则将当前识别结果拼接到上一次识别结果后面; 108、接收下一时间步音频片段,返回步骤101; 识别单词的时间戳时,从解码器预测输出的最后一个单词向前依次计算每个单词的时间戳,具体包括以下步骤: 计算解码器预测输出的最后一个单词的时间戳,从输入编码器的最后一个时间步的音频特征开始,从后往前遍历编码器的每一个时间步; 每遍历到一个新的编码器时间步,都需通过缩放点积注意力计算出当前单词与输入当前编码器时间步的音频特征的归一化匹配得分; 若当前单词与当前时间步音频特征的匹配得分小于0.2,或者当前单词的前一个单词与该时间步音频特征的匹配得分大于当前单词与该段音频特征的匹配得分,则停止计算当前单词与其他音频特征的匹配得分,记录该段音频特征在编码器的时间步t; 把满足要求的音频特征合并到一起,形成音频片段,计算该音频片段的起始时间、终止时间,由此得到当前单词的时间戳; 将时间步t作为下一个单词的起始时间步继续往前计算满足要求的时间步,根据满足要求的时间步计算时间戳,重复以上步骤计算所有单词的时间戳。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人沪渝人工智能研究院,其通讯地址为:401332 重庆市沙坪坝区西园北街31号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。