北京搜狐新媒体信息技术有限公司王天齐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京搜狐新媒体信息技术有限公司申请的专利一种从文本获取帧序列的方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120279470B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510758551.2,技术领域涉及:G06V20/40;该发明授权一种从文本获取帧序列的方法及相关装置是由王天齐;黎斯思;王卿云;章岑;杨田设计研发完成,并于2025-06-09向国家知识产权局提交的专利申请。
本一种从文本获取帧序列的方法及相关装置在说明书摘要公布了:本申请公开了一种从文本获取帧序列的方法及相关装置,涉及文生图技术领域,基于输入文本,获取表达输入文本的图像帧的帧描述文本和各帧的布局信息,获取输入文本的文本嵌入,基于各角色的参考图像,获取参考图像的图像嵌入,将图像嵌入与布局信息相融合,得到第一融合信息,将文本嵌入与布局信息相融合,得到第二融合信息,基于时空自注意力机制,对信息进行融合,得到包括图像帧的帧序列,因为第一融合信息表示各图像嵌入在各帧中的第一位置关系,第二融合信息表示各文本嵌入在各帧中的第二位置关系,目标帧的布局信息指示目标帧中的各个角色的空间信息,因此,能够降低不同角色在帧中相互影响的可能性,保证角色在帧间的一致性。
本发明授权一种从文本获取帧序列的方法及相关装置在权利要求书中公布了:1.一种从文本获取帧序列的方法,其特征在于,包括: 基于输入文本,获取帧描述文本和各帧的布局信息,所述帧包括用于表达所述输入文本的图像帧,目标帧的所述布局信息指示所述目标帧中的各个角色的空间信息; 获取所述输入文本的文本嵌入; 基于用户输入的各角色的参考图像,在去除所述参考图像中与所述角色无关的信息后,获取所述参考图像的图像嵌入,所述角色是所述输入文本表述的角色; 将所述图像嵌入与所述布局信息相融合,得到第一融合信息,所述第一融合信息表示各图像嵌入在各帧中的第一位置关系; 将所述文本嵌入与所述布局信息相融合,得到第二融合信息:将注意力机制的隐状态与各个文本嵌入进行第一运算,得到第二参数,将所述第二参数与面积平衡矩阵、第二掩码矩阵进行第三运算,得到第三参数,所述面积平衡矩阵用于平衡各个角色在所述目标帧中所占的面积,所述第二掩码矩阵基于所述布局信息获取,将所述第三参数与各个文本嵌入进行第四运算,得到所述第二融合信息,所述第二融合信息表示各文本嵌入在各帧中的第二位置关系; 基于时空自注意力机制,对信息进行融合,得到包括所述图像帧的帧序列,进行融合的所述信息包括所述第一融合信息、所述第二融合信息以及所述各个角色的信息,各个角色的信息中的任意一个角色的信息,是指在生成包括该单一角色的图像后,从包含该单一角色的图像中提取的该角色的信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京搜狐新媒体信息技术有限公司,其通讯地址为:100190 北京市海淀区科学院南路2号院3号楼12层1201;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。