Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国电子科技集团公司第二十八研究所汤闻易获国家专利权

中国电子科技集团公司第二十八研究所汤闻易获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国电子科技集团公司第二十八研究所申请的专利一种面向陆空通话场景基于增量学习的语音识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120544546B

龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511038617.7,技术领域涉及:G10L15/06;该发明授权一种面向陆空通话场景基于增量学习的语音识别方法是由汤闻易;刘泽原;张明伟;张阳;周超;蒋璐;白俊奇;孙英晖;吴丽军;葛昊;田云钢;刘胜新设计研发完成,并于2025-07-28向国家知识产权局提交的专利申请。

一种面向陆空通话场景基于增量学习的语音识别方法在说明书摘要公布了:本发明公开了一种面向陆空通话场景基于增量学习的语音识别方法,包括:步骤1:构建语音识别模型的词表,在词表中预留槽位;步骤2:计算模型参数重要性矩阵,生成模型参数训练掩码;步骤3:根据需要添加的新专有名词,采集并标注少量新通话片段作为训练数据和测试数据;步骤4:预训练语音识别模型,并加载语音识别模型参数训练掩码,结合交叉熵损失进行增量训练,训练过程中定期在测试数据上测试识别准确率;步骤5:使用最新训练的语音识别模型参数替换原先的语音识别模型,完成模型的增量学习;步骤6:使用完成增量学习的语音识别模型对语音进行识别。有效克服了现场部署环境下模型无法快速适应新增术语且不遗忘旧知识的缺陷。

本发明授权一种面向陆空通话场景基于增量学习的语音识别方法在权利要求书中公布了:1.一种面向陆空通话场景基于增量学习的语音识别方法,其特征在于,包括如下步骤: 步骤1:构建语音识别模型的词表,在词表中预留槽位; 步骤2:计算模型参数重要性矩阵,生成模型参数训练掩码; 步骤3:根据需要添加的新专有名词,采集并标注少量新通话片段作为训练数据和测试数据; 步骤4:预训练语音识别模型,并加载语音识别模型参数训练掩码,结合交叉熵损失进行增量训练,训练过程中定期在测试数据上测试识别准确率; 步骤5:使用最新训练的语音识别模型参数替换原先的语音识别模型,完成模型的增量学习; 步骤6:使用完成增量学习的语音识别模型对语音进行识别; 步骤2所述的计算模型参数重要性矩阵,生成模型参数训练掩码,具体包括: 步骤2-1:在语音识别模型初始训练完成后,使用初始训练数据计算每个模型参数的参数重要性,形成模型参数重要性矩阵; 步骤2-2:基于预设的重要性阈值对所述重要性矩阵进行二值化处理,生成模型参数训练掩码:将重要性分数高于阈值的参数标记为重要参数,其余参数标记为可调参数; 步骤2-1具体包括: 步骤2-1-1:对于初始训练数据中的每个样本,计算模型输出与真实标签的交叉熵损失; 步骤2-1-2:计算所述交叉熵损失对每个模型参数的梯度; 步骤2-1-3:对每个模型参数,计算其梯度平方值在初始训练数据上的期望,作为该模型参数的参数重要性,对于第i个模型参数的参数重要性定义为: ; 其中,表示初始训练数据集合,表示初始训练数据集合中的样本数量,表示模型所有参数的集合,表示模型的当下参数取值,是每个样本的输入值,是模型对x的输出,是偏微分,是对数函数,表示对于某个样本来说第i个参数在交叉熵损失中的梯度; 步骤2-2具体实现为: 步骤2-2-1:设定重要性阈值threhold,所述重要性阈值threhold的确定方式包括: (1)计算重要性矩阵中所有参数的分数分布第K百分位数作为threhold,其中K∈[30,39]; (2)通过验证集上的抗遗忘效果与模型可塑性平衡实验确定; 步骤2-2-2:对重要性矩阵进行逐元素二值化操作: 若参数重要性分数threhold,则输出掩码值1;否则输出掩码值0; 对于第i个模型参数来说,它对应的第i个掩码值为: ; 步骤2-2-3:将二值化结果存储为结构化二进制矩阵,其维度与模型参数张量维度一致,且1值位置对应需锁定的模型参数; 步骤4具体包括: 步骤4-1:加载预训练语音识别模型及步骤2生成的模型参数训练掩码; 步骤4-2:根据所述模型参数训练掩码,冻结掩码值为1对应的模型参数,仅保留掩码值为0的模型参数为可训练状态,即在使用梯度更新模型参数时只更新可训练的模型参数; 步骤4-3:使用步骤3采集的训练数据集,以交叉熵损失函数进行增量训练,训练过程中采用小批量随机梯度下降法,批量大小设置为B; 步骤4-4:在增量训练过程中,每训练E个批次后,在步骤3采集的测试数据集上评估当前模型的识别准确率; 步骤4-5:若满足预设的早停条件,则触发早停机制并执行步骤5。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第二十八研究所,其通讯地址为:210023 江苏省南京市栖霞区仙林灵山南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。