当前位置 : 首页 > 专利喜报 > 浙江大学宋杰获国家专利权

浙江大学宋杰获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉浙江大学申请的专利基于预训练语言模型的中文唇语识别提升方法与装置获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN119446144B 。

龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202411356079.1，技术领域涉及：G10L15/25；该发明授权基于预训练语言模型的中文唇语识别提升方法与装置是由宋杰;黎佩瑜;宋明黎;张东祥设计研发完成，并于2024-09-27向国家知识产权局提交的专利申请。

本基于预训练语言模型的中文唇语识别提升方法与装置在说明书摘要公布了：基于预训练语言模型的中文唇语识别提升方法和装置，其方法包括：构建纠错数据集，通过同音词增强和混淆矩阵数据增强方法拓展数据集规模；对纠错数据集进行预处理，通过分词模型将字符映射为对应的令牌，然后再通过嵌入层映射为词嵌入。通过预训练语言模型对纠错句子进行特征提取；预训练语言模型输出的特征通过线性错误预测层输出错误字符的位置，线性错误纠正层对错误字符进行纠正；基于错误检测损失函数和错误纠正损失函数训练纠错网络，并且在训练过程中使用填充策略提升模型的纠错准确率；基于训练好的唇语纠错网络对唇语识别结果进行改善。本发明有效地降低了自回归和非自回归模型的字符错误率，并且易于迁移到其他模型。

本发明授权基于预训练语言模型的中文唇语识别提升方法与装置在权利要求书中公布了：1.一种基于预训练语言模型的中文唇语识别提升方法，包含如下步骤：步骤1，构建纠错数据集，通过步骤1中的数据增强方法拓展数据集规模；步骤2，对纠错数据集进行预处理，通过分词模型将字符映射为对应的令牌token，然后再通过嵌入层映射为词嵌入；步骤3，通过预训练语言模型对纠错句子进行特征提取，得到输入文本特征；选取MacBERT作为预训练语言模型进行文本特征提取，采用的是Transformer编码器结构，由多个相同的模块组成，每个模块包含一个多头自注意力操作，后跟一个前馈网络；步骤4，预训练语言模型输出的特征通过线性错误预测层输出错误字符的位置，线性错误纠正层对错误字符进行纠正；步骤5，基于错误检测损失函数和错误纠正损失函数训练纠错网络，并且在训练过程中使用填充策略提升模型的纠错准确率；具体包括：步骤5-1，由于输入句子序列长度的限制，预训练模型无法灵活地将标记映射到不同的位置，采用了一种填充策略来解决索引对应的差异；使用来自分词器的特殊标记来填充输入句子，使纠错网络能够将修正后的标记映射到填充句子中的不同位置；步骤5-2，基于提供的预训练MacBERT模型进行微调；微调数据集由原始文本X、修正后的文本Y和错误索引G组成，表示为{X1,Y1,G1…XN,YN,GN}；纠错模块的损失函数由错误检测损失和错误修正损失组成；是错误检测网络的损失函数；是错误修正网络的损失函数；是纠错模块的损失函数，而ω是错误检测网络损失的权重：步骤6，基于训练好的唇语纠错网络对唇语识别结果进行改善。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人浙江大学，其通讯地址为：310058 浙江省杭州市西湖区余杭塘路866号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

浙江大学宋杰获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务