重庆邮电大学吴德成获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于神经网络和视听融合的声乐表演评分方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115579021B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211165910.6,技术领域涉及:G10L25/51;该发明授权一种基于神经网络和视听融合的声乐表演评分方法及系统是由吴德成;赵鑫;覃巍;郑越;许文海;杨平安;谢昊飞;熊美姝设计研发完成,并于2022-09-23向国家知识产权局提交的专利申请。
本一种基于神经网络和视听融合的声乐表演评分方法及系统在说明书摘要公布了:本发明涉及一种基于神经网络和视听融合的声乐表演评分方法及系统,属于声乐测评领域。该方法利用不同的神经网络分别得到三个维度的专家评分数据,包括音频评分、情感评分与着装评分,然后将三个维度的评分输入到专家评分拟合神经网络,最后得到综合评分。本发明使评测结果更加真实有效、贴近专家评分,评分流程更加高效便捷。
本发明授权一种基于神经网络和视听融合的声乐表演评分方法及系统在权利要求书中公布了:1.一种基于神经网络和视听融合的声乐表演评分方法,其特征在于,利用不同的神经网络分别得到三个维度的评分数据,包括音频评分、情感评分与着装评分,然后将三个维度的评分输入到视听融合专家评分网络,最后得到总体评分;该方法具体包括以下步骤: S1:获取表演者的音频数据,预处理得到高音特征和节奏特征,然后分别与标准音频数据对比得到最小距离向量和节奏契合度,并将其输入音频评分神经网络中得到音频评分; S2:对演唱视频进行关键帧提取,预处理得到关键帧对应的音频和人脸区域图片,从中对应提取音高序列和面部特征,将其对应输入到音频情感神经网络和人脸关键点检测器中,得到音频情感特征向量和面部表情特征向量,然后计算音频情感特征向量与面部情感特征向量的欧式距离,即特征向量相似性;最后将特征向量相似性输入视听融合情感评分神经网络中得到情感评分; S3:截取演唱视频中一帧的图片,从中提取服装的关键特征,输入服装风格评估神经网络得到演唱者服装风格图像特征向量;然后从对应视频的音频数据中得到梅尔频谱图,输入音频风格评估神经网络得到演唱者音乐风格特征向量;最后将演唱者的服装风格特征向量和音乐风格特征向量输入视听融合着装评分神经网络中得到着装评分; S4:将音频评分、情感评分和着装评分输入到视听融合专家评分网络,得到总体评分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区黄桷垭崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励