Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京信息工程大学曹子聪获国家专利权

南京信息工程大学曹子聪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京信息工程大学申请的专利一种基于扩散模型的图像生成身份个性化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120953049B

龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511471948.X,技术领域涉及:G06T3/04;该发明授权一种基于扩散模型的图像生成身份个性化方法是由曹子聪;李梓强;芮雪设计研发完成,并于2025-10-15向国家知识产权局提交的专利申请。

一种基于扩散模型的图像生成身份个性化方法在说明书摘要公布了:本发明提供了一种基于扩散模型的图像生成身份个性化方法,包括:步骤1,构建身份语义解耦训练框架:建立身份增强模型,所述身份增强模型在原始SDXL1.0模型上额外引入了图像交叉注意力模块;步骤2,建立混合注意力融合机制,然后进行混合注意力融合;步骤3,风格生成:在原始SDXL1.0模型的自注意力层中对键、值特征执行混合操作,即一种结合自适应均值归一化与均值对齐的操作,以进一步将合成图像的风格与输入的风格提示对齐。本方案在保持文本语义编辑能力的前提下,突破现有方法在身份一致性保持方面的局限,定制化生成双人图像,而且能够控制生成图像的风格,适用于数字内容创作、虚拟形象生成等需要精准身份控制的场景。

本发明授权一种基于扩散模型的图像生成身份个性化方法在权利要求书中公布了:1.一种基于扩散模型的图像生成身份个性化方法,其特征在于,包括以下步骤: 步骤1,构建身份语义解耦训练框架:建立身份增强模型,所述身份增强模型在原始SDXL1.0模型上额外引入了图像交叉注意力模块; 原始SDXL1.0模型的U型网络Unet中包含自注意力层和交叉注意力层; 同时使用身份增强模型和原始SDXL1.0模型做推理,身份增强模型用ID分支表示,原始SDXL1.0模型用语义分支表示; 步骤2,建立混合注意力融合机制,从原始SDXL1.0模型的自注意力层提取语义分支的键、值,从身份增强模型的自注意力层提取代表身份特征的ID分支的键、值,然后进行混合注意力融合; 步骤3,风格生成:在原始SDXL1.0模型的自注意力层中对键、值特征执行混合操作AdaIN-mean,即一种结合自适应均值归一化与均值对齐的操作,以进一步将合成图像的风格与输入的风格提示对齐; 步骤1包括如下步骤: 步骤1-1,在原始SDXL1.0模型中,引入一个额外的可训练的图像交叉注意力模块,通过人脸识别模型导出人脸的全局图像嵌入,通过CLIP图像编码器导出人脸的局部嵌入,并使人脸的全局图像嵌入、局部嵌入与预训练扩散模型的文本特征的维度对齐; 步骤1-2,训练时仅优化人脸识别模型和CLIP图像编码器和图像交叉注意力模块参数,停用原始SDXL1.0模型的U型网络Unet中文本嵌入的交叉注意力模块;预训练扩散模型参数保持冻结; 步骤1-3,定义训练目标函数; 步骤3包括:所述将合成图像的风格与风格提示对齐,用于在生成时实现文本提示中的两种以上风格; 将混合注意力和图像交叉注意力中从投影的键特征和值特征,与从文本特征投影的键特征和值特征均值归一化对齐,公式为: , , , , 其中,表示AdaIN-mean操作,定义为: , 其中,是ID分支键值特征的均值,a表示ID分支的键值,b表示语义分支的键值,是语义分支的键值特征的均值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:211899 江苏省南京市江北新区华富路1号数智溪谷4号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。