Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学王瑜彤获国家专利权

北京理工大学王瑜彤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利一种音频引导的视频生成方法、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119071568B

龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411174397.6,技术领域涉及:H04N21/44;该发明授权一种音频引导的视频生成方法、设备及介质是由王瑜彤;朱斯丹;罗迪新设计研发完成,并于2024-08-26向国家知识产权局提交的专利申请。

一种音频引导的视频生成方法、设备及介质在说明书摘要公布了:本发明提供了一种音频引导的视频生成方法、设备及介质,包括:将音频和视频分割为序列音频片段和视频片段;将所述音频片段与视频片段输入神经网络得到音频片段与视频片段的对应关系;根据音频片段的时序和时长,以及音视频片段的对应关系,调整对应视频片段的时长后按序拼接生成目标视频;所述音频作为目标视频的背景音乐。采用上述技术方案,可以实现目标视频和训练数据集全部由自动化技术生成,免去人工标注带来的挑战,扩大训练数据集的规模,提升剪辑者工作效率的同时,也有助于激发创作者灵感。

本发明授权一种音频引导的视频生成方法、设备及介质在权利要求书中公布了:1.一种音频引导的视频生成方法,其特征在于, 将音频和视频分割为序列音频片段和视频片段; 将所述音频片段与视频片段输入神经网络得到音频片段与视频片段的对应关系; 根据音频片段的时序和时长,以及音视频片段的对应关系,调整对应视频片段的时长后按序拼接生成目标视频;所述音频作为目标视频的背景音乐; 所述神经网络包括视频编码器、音频编码器、视频选择器和音视频匹配器; 视频编码器用于对视频片段进行编码得到视频片段特征;音频编码器用于对音频片段进行编码得到音频片段特征; 视频选择器用于基于视频片段特征和音频片段特征获取视频片段融合特征和音频片段融合特征,并基于视频片段融合特征得到各视频片段的选择概率; 音视频匹配器用于基于音频片段融合特征、视频片段融合特征、以及视频片段的选择概率,通过音视频片段对齐获取音频片段与视频片段的对应关系;所述音视频匹配器通过求解熵最优传输EOT问题,得到最优传输矩阵,获得音频片段和视频片段的对应关系: 其中,表示视频片段融合特征和音频片段融合特征的距离矩阵;T为传输方案,表示视频片段和音频片段间的对应关系矩阵,表示矩阵和矩阵的内积计算;,表示所有传输方案的集合,其中在计算过程中需要满足:对的每一行求和后得到的列向量中的元素等于向量中对应位置的元素,是列向量中元素之和,是视频片段的选择概率向量;为,表示长度为,值全为的列向量,为音频片段的数量;超参数是熵正则化项的权重,表示矩阵和矩阵的内积计算。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100080 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。