Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 马栏山音视频实验室庄正中获国家专利权

马栏山音视频实验室庄正中获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉马栏山音视频实验室申请的专利视频内容修改方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119653198B

龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411842689.2,技术领域涉及:H04N21/81;该发明授权视频内容修改方法、装置、电子设备及存储介质是由庄正中设计研发完成,并于2024-12-13向国家知识产权局提交的专利申请。

视频内容修改方法、装置、电子设备及存储介质在说明书摘要公布了:本发明提供一种视频内容修改方法、装置、电子设备及存储介质,涉及多媒体技术领域,该方法包括:提取原始视频中目标人物的初始音频,根据初始音频提取目标人声和音频文本;修改音频文本获得目标文本,根据目标文本和目标人声合成目标音频;根据目标音频录制面部口型视频,获得驱动视频;根据驱动视频和目标音频进行口型校准,获得标准驱动视频;将标准驱动视频和原始视频输入隐式关键点驱动模型,获得合成视频。本发明通过录制面部驱动视频来提供自然的口型、表情和头部姿态,使得生成的视频在口型方面更加逼真和流畅,确保最终的视频效果更加符合期望,驱动视频和音频通过在隐空间内进行推理和训练,提高了视频生成的速度和质量。

本发明授权视频内容修改方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种视频内容修改方法,其特征在于,所述方法包括: 提取原始视频中目标人物的初始音频,根据所述初始音频提取目标人声和音频文本; 修改所述音频文本获得目标文本,根据所述目标文本和所述目标人声合成目标音频; 根据所述目标音频录制面部口型视频,获得驱动视频; 根据所述驱动视频和所述目标音频进行口型校准,获得标准驱动视频; 将所述标准驱动视频和所述原始视频输入隐式关键点驱动模型,获得合成视频,包括: 获取所述标准驱动视频的每一帧驱动图片和所述原始视频的每一帧原始图片; 将所述驱动图片和所述原始图片从像素空间编码至隐空间,获得隐空间驱动特征图和隐空间原始特征图; 根据所述隐空间驱动特征图和所述隐空间原始特征图生成隐空间合成特征图; 将所述隐空间合成特征图从隐空间解码至像素空间,获得每一帧合成图片; 根据所述合成图片和所述目标音频生成所述合成视频; 其中,所述根据所述隐空间驱动特征图和所述隐空间原始特征图生成隐空间合成特征图,包括: 提取所述隐空间原始特征图中所述目标人物的外观特征,获得目标外观特征; 分别提取所述隐空间原始特征图和所述隐空间驱动特征图中所述目标人物的动作特征,获得原始目标动作特征和驱动目标动作特征; 将所述目标外观特征、所述原始目标动作特征和所述驱动目标动作特征进行特征封装,获得封装特征图; 对所述封装特征图进行解码,获得所述隐空间合成特征图; 其中,所述将所述目标外观特征、所述原始目标动作特征和所述驱动目标动作特征进行特征封装,获得封装特征图,包括: 通过变形场估计器预测所述目标外观特征、所述原始目标动作特征和所述驱动目标动作特征的变形场,所述变形场为图像或物体在变形过程中每个像素或点位移的向量场; 根据所述变形场对所述目标外观特征、所述原始目标动作特征和所述驱动目标动作特征进行封装,获得封装特征图。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人马栏山音视频实验室,其通讯地址为:410000 湖南省长沙市开福区月湖街道文创路6号马栏山创意中心B栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。