贵州大学;贵州移动信息科技有限公司张磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉贵州大学;贵州移动信息科技有限公司申请的专利方言语音识别方法、系统及模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121053966B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511593011.X,技术领域涉及:G10L15/00;该发明授权方言语音识别方法、系统及模型是由张磊;冯竣添;冯焱;朱淇;肖丹;邓千;陈澈;杨静;蒋诗怡;刘庭卿;吴忠银;崔艳哲;肖明胜设计研发完成,并于2025-11-03向国家知识产权局提交的专利申请。
本方言语音识别方法、系统及模型在说明书摘要公布了:本发明属于语音识别技术领域,具体涉及一种方言语音识别方法、系统及模型。其中,方言语音识别方法包括:S1,若干教师模型生成伪标签并筛选;S2,子模型训练;S3,数据融合;S4,学生模型训练,重复步骤S3至S4,直至进行了轮融合训练,得到各地区各自训练完成的学生模型。本发明通过结合多教师模型知识蒸馏与K最近邻动态数据融合训练,构建适用于多方言场景的端到端语音转写方法,特别适用于声调体系复杂、语音变体丰富、数据稀缺的少资源方言环境。
本发明授权方言语音识别方法、系统及模型在权利要求书中公布了:1.一种方言语音识别方法,其特征在于,所述方言语音识别方法包括: S1,获取若干地区的地区数据集,所述地区数据集包括若干条无标注的方言语音样本,采用若干不同结构的教师模型对所有的所述方言语音样本进行推理,得到所述方言语音样本对应的多个候选标签,从多个所述候选标签中筛选出所述方言语音样本对应的伪标签,得到包括若干条具有伪标签的方言语音样本的若干所述地区数据集; S2,使用各地区的所述地区数据集对各自的子模型进行初始化训练,得到各地区各自训练后的子模型; S3,计算每个地区的子模型在其他地区数据集上的识别准确率,得到方言相似度矩阵,在所述方言相似度矩阵中,选取与当前地区识别准确率最高的一个其他地区作为邻居地区,将所述邻居地区对应的地区数据集合并入当前地区的地区数据集中,形成增强的地区数据集; S4,使用各地区增强的所述地区数据集对各自的学生模型进行训练,重复步骤S3至S4,直至进行了轮融合训练,得到各地区各自训练完成的学生模型; 在步骤S3中,采用交叉验证的方式,将地区i的地区数据集在地区j的子模型上进行识别,其中,得到转写文本,将地区i的地区数据集在自身对应的子模型上进行识别得到的撰写文本与转写文本进行比较,得到子模型对地区数据集的识别准确率,其中, 所述识别准确率的计算公式为: ; ; ; 其中,WER表示撰写文本与转写文本之间的词错误率,S1表示替换错误的词数,D1表示删除错误的词数,I1表示插入错误的词数,N1表示参考文本中的总词数;CER表示撰写文本与转写文本之间字错误率,S2表示替换错误的字符数,D2表示删除错误的字符数,I2表示插入错误的字符数,T表示参考文本中的总字符数; 将所有交叉验证结果构成维的方言相似度矩阵,则: ; 对于地区i,在方言相似度矩阵中,选取除自身外识别准确率最高的地区j作为邻居地区,将邻居地区对应的地区数据集合并入地区数据集中,形成增强的地区数据集; 在所述方言相似度矩阵中,将低于预设的相似度极限阈值的元素置零; 其中,在步骤S3中,选取与当前地区识别准确率最高的一个其他地区作为邻居地区之后,将所述邻居地区对应的地区数据集合并入当前地区的地区数据集中之前,还包括:判断选取的最高的识别准确率是否不小于预设的动态阈值,当不小于时,将所述邻居地区对应的地区数据集合并入当前地区的地区数据集中,否则放弃合并; 其中,在步骤S3中,对增强的地区数据集进行样本均衡处理,所述样本均衡处理的方式为,若任一地区数据集中方言语音样本数量大于预设数量,则随机删除部分方言语音样本直至地区数据集中方言语音样本数量不大于预设数量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人贵州大学;贵州移动信息科技有限公司,其通讯地址为:550025 贵州省贵阳市花溪区贵州大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励