上海青瞳视觉科技有限公司王雅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海青瞳视觉科技有限公司申请的专利一种基于深度学习的普通话发音评估系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120431970B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510913803.4,技术领域涉及:G10L25/51;该发明授权一种基于深度学习的普通话发音评估系统是由王雅;王佳耀;李亚舟;曲慧佳;张海威;严峰;罗莎;张昭;张群;蒋月设计研发完成,并于2025-07-03向国家知识产权局提交的专利申请。
本一种基于深度学习的普通话发音评估系统在说明书摘要公布了:本申请公开了一种基于深度学习的普通话发音评估系统,涉及语音评分的技术领域,其包括数据输入端口:用于获取抄本、标准音高曲线以及标准口型视频,将用户朗读时的面部口型运动和声音拍摄为视频,从视频中提取音频;数据处理器:用于对视频以及音频进行处理;音调评估器:用于音频进行评估得到音调评分;口型评估器:用于得到口型评分;发音评估器:用于得到发音评分;评分输出端:用于结合音调评分、口型评分以及发音评分,生成最终评分。本申请具有提升对普通话发音评分的准确性和自适应性的效果。
本发明授权一种基于深度学习的普通话发音评估系统在权利要求书中公布了:1.一种基于深度学习的普通话发音评估系统,其特征在于,包括: 数据输入端口:用于获取抄本、标准音高曲线以及标准口型视频,将用户朗读时的面部口型运动和声音拍摄为视频,从所述视频中提取音频; 数据处理器:用于对所述视频以及所述音频进行处理,得到所述音频的特征向量以及所述视频的测试单字视频和标准单字视频; 音调评估器:用于根据所述特征向量,对所述音频进行评估得到音调评分; 口型评估器:用于对所述测试单字视频以及所述标准单字视频进行相似度匹配,得到口型评分; 发音评估器:用于根据所述抄本,生成标准发音特征向量,根据所述音频提取得到测试发音特征向量,对所述标准发音特征向量以及所述测试发音特征向量进行相似度匹配,得到发音评分; 评分输出端:用于结合所述音调评分、所述口型评分以及所述发音评分,生成最终评分; 所述数据处理器包括: 强制对齐器、音高检测器以及音高特征提取器; 强制对齐器:用于将所述抄本、所述音频、所述标准音高曲线以及预设的声调序列输入所述强制对齐器中,所述强制对齐器提取所述抄本中每个文字在所述音频中对应的音频时间戳数据,根据所述音频时间戳数据对所述音频进行分段,得到音频段; 音高检测器:用于对每个文字的所述音频段进行音高检测,得到每个字发音所对应的测试音高曲线; 音高特征提取器:用于将所述测试音高曲线以及所述标准音高曲线进行多维度对比,提取所述测试音高曲线中的最大值、最小值、均值、标准差、曲线长度、动态时间规整分数、音高边界评分以及多项式回归特征,并进行整理,得到特征向量; 所述动态时间规整分数,具体为: 提取所述测试音高曲线的一阶差分,使用DTW计算测试音高曲线与标准音高曲线的DTW距离,归一化距离通过指数映射将距离转换为分数,公式: 其中,为调节参数,e是自然对数的底数; 所述音高边界评分,具体为: 提取所述测试音高曲线的起始值和结束值,标准测试音高的标准起始值和标准结束值,计算所述起始值、所述结束值与所述标准起始值、所述标准结束值之间的标准差,结合高斯分布概率计算得分,公式: 其中,e是自然对数的底数,pitchvalue是测试音高值,μ是标准音高的均值,σ是标准音高的标准差; 所述多项式回归特征,具体为: 对所述标准音高曲线以及所述测试音高曲线分别进行二次多项式拟合,得到所述标准音高曲线以及所述测试音高曲线的一次项系数差和二次项系数差,根据所述一次项系数差和所述二次项系数差得到多项式回归特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海青瞳视觉科技有限公司,其通讯地址为:200040 上海市静安区延长路149号151幢528室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。