中国电子科技集团公司第二十八研究所汤闻易获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团公司第二十八研究所申请的专利一种基于语速感知的空管语音识别模型的语音识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120510850B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511021857.6,技术领域涉及:G10L15/26;该发明授权一种基于语速感知的空管语音识别模型的语音识别方法是由汤闻易;席玉华;刘泽原;徐秋程;蒋伟煜;丁一波;丁辉;黄吉波;徐珂;张阳;张明伟设计研发完成,并于2025-07-24向国家知识产权局提交的专利申请。
本一种基于语速感知的空管语音识别模型的语音识别方法在说明书摘要公布了:本发明公开了一种基于语速感知的空管语音识别模型的语音识别方法,包括:步骤1:统计空管语音的正常语速区间;步骤2:构建包含所述语速估计层的空管语音识别模型;步骤3:定义联合损失函数,训练空管语音识别模型,并在训练过程中动态调整所述联合损失函数中CTC损失权重系数和语速感知损失权重系数;步骤4:使用训练后的语音识别模型对空管语音数据进行识别。本发明引入语速感知损失约束形成结合语音识别主任务与语速规律学习辅助任务的多任务学习机制,显著提升了空管陆空通话语音识别模型在复杂环境下的鲁棒性和识别准确率,为空管安全高效运行提供更可靠的技术支撑。
本发明授权一种基于语速感知的空管语音识别模型的语音识别方法在权利要求书中公布了:1.一种基于语速感知的空管语音识别模型的语音识别方法,其特征在于,包括如下步骤: 步骤1:统计空管语音的正常语速区间; 步骤2:构建包含语速估计层的空管语音识别模型; 步骤3:定义联合损失函数,训练空管语音识别模型,并在训练过程中动态调整所述联合损失函数中CTC损失权重系数和语速感知损失权重系数; 步骤4:使用训练后的空管语音识别模型对空管语音进行识别; 步骤1中所述的统计空管语音的正常语速区间,具体包括: 步骤1-1:定义中英文语速统计算法,对中文陆空通话语音,统计单位时间内识别文本的字符数量作为语速指标;对英文陆空通话语音,统计单位时间内识别文本的单词数量作为语速指标; 步骤1-2:在事先采集的空管语音识别训练数据集上分别统计中文语速和英文语速; 步骤1-3:设定中文语音的正常语速区间为字符秒,其中,其中为中文正常语速最低值,和为中文正常语速最高值和通过计算所述空管语音识别训练数据集中字符速率确定; 步骤1-4:设定英文语音的正常语速区间为单词秒,其中,为英文正常语速最低值,为英文正常语速最高值,和通过计算所述空管语音识别训练数据集中单词速率确定; 步骤2-2中所述的语速估计层,具体包括: 步骤2-2-1:接收空管语音识别模型主干网络输出的原始logits序列,记为,其中,为为时间步数T所对应的原始logits序列,为时间步数,为词汇表大小; 步骤2-2-2:对原始logits序列进行锐化操作:将原始logits乘以预设的放大系数,得到锐化后的logits,记为; 步骤2-2-3:计算加权字符概率分布:对锐化后的logits沿词汇维度执行softmax操作,生成概率分布矩阵,其中,为激活函数,是模型输出的时间维度大小,是模型输出的词表维度大小; 步骤2-2-4:基于概率分布矩阵估计有效字符数量; 步骤2-2-5:计算有效字符速率,根据输入语音时长,输出速率; ; 其中,对于英文语音,所述词表维度大小V以完整单词为基本单位,故表征估计的单词数量,输出速率单位相应为单词秒;对于中文语音,所述词表维度大小V以字符为基本单位,故表征估计的字符数量;输出速率单位相应为字符秒。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第二十八研究所,其通讯地址为:210023 江苏省南京市栖霞区仙林灵山南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励