粤港澳大湾区数字经济研究院(国际先进技术应用推进中心(深圳));杭州盖视科技有限公司刘云飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉粤港澳大湾区数字经济研究院(国际先进技术应用推进中心(深圳));杭州盖视科技有限公司申请的专利人像对话视频生成方法、多人对话视频生成方法、产品、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121000955B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511518090.8,技术领域涉及:H04N21/854;该发明授权人像对话视频生成方法、多人对话视频生成方法、产品、设备及存储介质是由刘云飞;朱蕾;林丽健;祝叶;李昱;余飞;周昌印;幺宝刚设计研发完成,并于2025-10-23向国家知识产权局提交的专利申请。
本人像对话视频生成方法、多人对话视频生成方法、产品、设备及存储介质在说明书摘要公布了:本申请公开了一种人像对话视频生成方法、多人对话视频生成方法、产品、设备及存储介质,涉及人工智能技术领域,人像对话视频生成方法包括:从参考人脸图像提取第一对话对象的人脸参数;基于参考音频分别确定第一对话对象的主音频和第二对话对象的次音频;融合第一对话对象的主音频和第二对话对象的次音频得到融合音频特征;根据融合音频特征和第一对话对象的人脸参数构建第一对话对象的三维人像几何序列;基于参考音频、参考人脸图像、融合音频特征和三维人像几何序列生成第一对话对象的人像对话视频。本申请旨在支持人像对话视频中对话对象自身说话与倾听状态的动态切换,提高对话对象的人像表情建模精度,并提升多人对话的交互流畅度。
本发明授权人像对话视频生成方法、多人对话视频生成方法、产品、设备及存储介质在权利要求书中公布了:1.一种人像对话视频生成方法,其特征在于,所述人像对话视频生成方法包括: 获取参考音频和参考人脸图像; 从所述参考人脸图像中提取第一对话对象的人脸参数; 基于所述参考音频分别确定第一对话对象的主音频和第二对话对象的次音频,其中,第二对话对象至少包含一个除所述第一对话对象以外的对话对象; 对所述第一对话对象的主音频和所述第二对话对象的次音频进行融合,得到融合音频特征; 根据所述融合音频特征和所述第一对话对象的人脸参数构建所述第一对话对象的三维人像几何序列; 基于所述参考音频、所述参考人脸图像、所述融合音频特征和所述第一对话对象的三维人像几何序列生成所述第一对话对象的人像对话视频; 其中,所述对所述第一对话对象的主音频和所述第二对话对象的次音频进行融合,得到融合音频特征的步骤包括; 为所述第一对话对象的主音频添加指示标识,其中所述指示标识用于标记用以驱动第一对话对象的音频; 将所述主音频、所述次音频以及所述指示标识输入预设的多音频交互融合模块,生成融合音频特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人粤港澳大湾区数字经济研究院(国际先进技术应用推进中心(深圳));杭州盖视科技有限公司,其通讯地址为:518045 广东省深圳市福田区福保街道市花路长富金茂大厦1号楼3901单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励