江苏智慧保业科技有限公司陈琰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏智慧保业科技有限公司申请的专利一种用于合成视频的语音识别方法、系统及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120260544B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510395651.3,技术领域涉及:G10L15/02;该发明授权一种用于合成视频的语音识别方法、系统及存储介质是由陈琰;宋仁骥;贺林设计研发完成,并于2025-03-31向国家知识产权局提交的专利申请。
本一种用于合成视频的语音识别方法、系统及存储介质在说明书摘要公布了:本发明涉及语音识别技术领域,具体公开了一种用于合成视频的语音识别方法,其先获取目标合成视频,并对目标合成视频进行多模态特征提取,得到多模态特征数据,然后根据多模态特征数据,建立多模态特征向量,之后根据多模态特征向量对目标合成视频内容进行领域识别,得到目标合成视频的内容领域分类数据,最后基于内容领域分类数据对目标合成视频进行语音识别,得到语音识别结果。相比于现有技术,发明通过对合成视频进行多模态特征提取的方式,识别出视频的专业领域,然后根据视频的具体领域优化语音识别以提高语音识别在特定专业领域下的准确性,解决了现有的语音识别技术在面对领域过于专业的合成视频时准确度不高的问题。
本发明授权一种用于合成视频的语音识别方法、系统及存储介质在权利要求书中公布了:1.一种用于合成视频的语音识别方法,其特征在于,包括以下步骤: 获取目标合成视频,并对目标合成视频进行多模态特征提取,得到多模态特征数据,其中,多模态特征数据包括边缘平滑指数和纹理重复指数,边缘平滑指数用于表征目标合成视频中画面内容的边缘的平滑程度,纹理重复指数用于表征目标合成视频中画面内容的纹理的重复程度; 根据多模态特征数据,建立多模态特征向量; 根据多模态特征向量对目标合成视频内容进行领域识别,得到目标合成视频的内容领域分类数据; 基于内容领域分类数据对目标合成视频进行语音识别,得到语音识别结果; 获取目标合成视频,并对目标合成视频进行多模态特征提取,得到多模态特征数据,包括: 根据目标合成视频,得到关键图像; 对关键图像进行图像特征提取,得到边缘平滑指数; 对关键图像进行图像特征提取,得到纹理重复指数; 根据目标合成视频,得到关键图像,包括: 从目标合成视频中抽取关键视频帧; 对关键视频帧进行目标检测,得到目标对象的位置和尺寸; 根据目标对象的位置和尺寸对关键视频帧进行裁剪,得到目标对象图像; 将关键视频帧和目标对象图像均作为关键图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏智慧保业科技有限公司,其通讯地址为:226000 江苏省南通市苏锡通科技产业园区凌霄路8号A1幢118室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励