百度(美国)有限责任公司周昕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉百度(美国)有限责任公司申请的专利从视频和文本输入生成高光时刻视频的方法、系统和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116170651B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210979659.0,技术领域涉及:H04N21/81;该发明授权从视频和文本输入生成高光时刻视频的方法、系统和存储介质是由周昕;亢乐;程治宇;田浩;卢大明;李大鹏;荀镜雅;王健宇;陈曦;李幸设计研发完成,并于2022-08-16向国家知识产权局提交的专利申请。
本从视频和文本输入生成高光时刻视频的方法、系统和存储介质在说明书摘要公布了:本文提供了用于自动和精确地生成内容的高光时刻视频或概要视频的系统、方法和数据集。在一个或多个实施例中,输入包括活动例如,比赛、音乐会等中的关键事件例如,进球、球员动作等的文本例如,文章以及活动的一个或多个视频。在一个或多个实施例中,输出是文本中的一个或多个事件的短视频,其中,视频可以包括高光时刻事件的评论和或其他音频例如音乐,其也可以被自动合成。
本发明授权从视频和文本输入生成高光时刻视频的方法、系统和存储介质在权利要求书中公布了:1.一种视频生成方法,包括: 给定提及活动中的事件的输入文本, 使用文本解析模块解析所述输入文本,以识别所述输入文本中提及的所述事件; 使用文本到语音TTS模块将所述输入文本转换为TTS生成的音频; 给定所述活动的至少一部分和所识别的事件的输入视频: 对所述输入视频的一组视频帧使用光学字符识别以读取所述输入视频中显示的时钟的时间;给定所述时钟的所识别的时间,生成包括所述活动的开始时间和任何时间偏移的一组时间锚;使用所述一组时间锚中的至少一些生成用于将所述时钟的时间与所述输入视频的运行时间进行关联的时间映射; 解析来自元数据的数据以获得所述事件的近似时间,所述元数据为与输入文本和所述活动对应的事件的评论信息和或标签信息;使用所述输入视频中的所述事件的近似时间和所述时间映射来生成初始视频剪辑; 利用预训练权重初始化慢快神经网络模型,将所述慢快神经网络模型调整为使用视觉和音频模式的不同损失函数的组合的分类器,利用该慢快神经网络模型的特征提取器部分从所述初始视频剪辑中提取特征,所述特征提取器被用于将视频剪辑分类为以下4个类别:远离兴趣事件、在兴趣事件之前、兴趣事件、在兴趣事件之后; 使用所提取的特征和训练后的神经网络模型,获得所述初始视频剪辑中所述事件的最终时间值; 响应于所述初始视频剪辑的运行时间与所述TTS生成的音频的运行时间不一致,通过将所述初始视频剪辑编辑为具有与所述TTS生成的音频的运行时间一致的运行时间来生成最终视频剪辑; 响应于所述初始视频剪辑的运行时间与所述TTS生成的音频的运行时间一致,使用所述初始视频剪辑作为所述最终视频剪辑; 将所述TTS生成的音频与所述最终视频剪辑组合,以生成事件高光时刻视频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人百度(美国)有限责任公司,其通讯地址为:美国加利福尼亚州;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。