Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京建筑大学王雪平获国家专利权

北京建筑大学王雪平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京建筑大学申请的专利基于文本的多模态人脸生成方法及装置、设备、存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119722837B

龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411715791.6,技术领域涉及:G06T11/00;该发明授权基于文本的多模态人脸生成方法及装置、设备、存储介质是由王雪平;高怡宣;霍悦萌;闫飞虎;赵光哲设计研发完成,并于2024-11-27向国家知识产权局提交的专利申请。

基于文本的多模态人脸生成方法及装置、设备、存储介质在说明书摘要公布了:本公开提供了基于文本的多模态人脸生成方法及装置、设备、存储介质,属于人脸图像生成技术领域,该方法包括:基于参考图像和参考图像对应的主体掩码确定主体图像,基于主体图像确定解耦全局身份嵌入特征。参考图像为初始人脸图像。基于参考图像和参考图像对应的掩码图像确定多模态局部身份嵌入特征。多模态局部身份嵌入特征为文本嵌入类特征。基于解耦全局身份嵌入特征和多模态局部身份嵌入特征确定目标生成人脸图像。本公开提供的基于文本的多模态人脸生成方法及装置、设备、存储介质能够提高文本到人脸生成的准确性,满足实际需求。

本发明授权基于文本的多模态人脸生成方法及装置、设备、存储介质在权利要求书中公布了:1.一种基于文本的多模态人脸生成方法,其特征在于,包括: 基于参考图像和所述参考图像对应的主体掩码确定主体图像;基于所述主体图像和第一编码器确定第一身份特征向量;基于属性方向和属性强度对第一身份特征向量进行向量编辑,生成第二身份特征向量;基于所述第二身份特征向量和映射网络确定解耦全局身份嵌入特征;所述属性方向为面部属性类别,所述属性强度为面部属性参数;所述参考图像为初始人脸图像; 基于所述参考图像和所述参考图像对应的掩码图像确定多模态局部身份嵌入特征;所述多模态局部身份嵌入特征为文本嵌入类特征; 基于所述解耦全局身份嵌入特征和所述多模态局部身份嵌入特征确定目标生成人脸图像;其中,所述基于所述解耦全局身份嵌入特征和所述多模态局部身份嵌入特征确定目标生成人脸图像,包括:将解耦全局身份嵌入特征和多模态局部身份嵌入特征输入目标扩散模型,生成目标生成人脸图像; 所述方法还包括: 基于参考图像和真实噪声确定噪声图像; 基于解耦全局身份嵌入特征、多模态局部身份嵌入特征和噪声图像生成预测噪声,基于解耦全局身份嵌入特征、多模态局部身份嵌入特征和噪声图像生成噪声重建图像,将预测噪声和噪声重建图像作为第一预测数据; 在第一损失步长内,基于第一损失函数计算真实噪声与预测噪声的第一损失; 在第二损失步长内,基于第二损失函数计算主体图像与噪声重建图像的第二损失; 基于第一损失和第二损失确定目标损失;基于目标损失对初始扩散模型进行更新,得到目标扩散模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京建筑大学,其通讯地址为:100044 北京市西城区展览路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。