Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川大学刘艳丽获国家专利权

四川大学刘艳丽获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川大学申请的专利一种基于扩散模型的解耦式图像风格迁移方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119599861B

龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411679369.X,技术领域涉及:G06T3/04;该发明授权一种基于扩散模型的解耦式图像风格迁移方法是由刘艳丽;王心雨;邢冠宇设计研发完成,并于2024-11-22向国家知识产权局提交的专利申请。

一种基于扩散模型的解耦式图像风格迁移方法在说明书摘要公布了:本发明提出了一种基于扩散模型的解耦式图像风格迁移方法,涉及图像处理领域,其中,该方法包括:构建一个基于内容和风格解耦的图像风格迁移模型,其中,图像风格迁移模型至少包括内容提取模块、风格提取模块、投影网络和风格迁移模块,模型从特征层面和网络层面同时对内容和风格进行解耦;构建一个涵盖多种数据类型的训练集;通过训练集和损失函数对图像风格迁移模型进行训练;基于训练好的图像风格迁移模型,输入内容图像和风格图像,生成具有目标内容和目标风格的风格化结果图像,具有提高风格迁移效果且更具可解释性的优点。

本发明授权一种基于扩散模型的解耦式图像风格迁移方法在权利要求书中公布了:1.一种基于扩散模型的解耦式图像风格迁移方法,其特征在于,包括: 构建一个基于内容和风格解耦的图像风格迁移模型,其中,所述图像风格迁移模型至少包括内容提取模块、风格提取模块、投影网络和风格迁移模块; 构建一个涵盖多种数据类型的训练集; 通过训练集和损失函数对图像风格迁移模型进行训练; 基于训练好的图像风格迁移模型,输入内容图像和风格图像,生成具有目标内容和目标风格的风格化结果图像; 所述内容提取模块用于从图像中提取内容信息,具体过程为: a、给定输入图像,通过亮度变换方法去除其颜色,得到图像的灰度图像; b、利用预训练的扩散模型对灰度图像进行前向加噪处理和反向去噪处理去除灰度图像的笔触和纹理风格细节,提取图像的内容; 所述风格提取模块用于从风格图像中提取风格表示,具体过程为: a、给定输入风格图像,通过内容提取模块提取风格图像的内容; b、将原始的风格图像输入到CLIP图像编码器获得包含风格及内容的全局表示,将风格图像的内容输入到CLIP图像编码器获得风格图像的内容表示,用全局表示减去内容表示得到风格表示,其表达式为: fs=EIs, 其中,Is表示风格图像,表示风格图像的内容,E表示CLIP图像编码器,fs表示风格图像的全局表示,表示风格图像的内容表示,表示风格图像的风格表示; 所述的风格迁移模块用于根据内容图像的内容特征和风格图像的风格特征进行风格迁移,通过在扩散模型捕捉风格信息的模块处添加一个新的交叉注意层,结合原始交叉注意层和新添加的交叉注意层将内容特征和风格特征分别注入扩散模型的去噪过程中,通过预训练扩散模型的原始交叉注意层插入内容图像的内容特征,其表达式为: Zc=AttentionQ,Kc,Vc, 其中,Q=ZWq是由查询特征Z和预训练扩散模型的交叉注意层的查询权重Wq计算得到的查询矩阵,Kc=ccWk是由内容特征cc和预训练扩散模型的交叉注意层的键权重Wk计算得到的键矩阵,Vc=ccWv是由内容特征cc和预训练扩散模型的交叉注意层的值权重Wv计算得到的值矩阵; 通过新的交叉注意层插入风格图像的风格特征,表达式为: Zs=AttentionQ,Ks,Vs, 其中,Q=ZWq是由查询特征Z和预训练扩散模型的交叉注意层的查询权重Wq计算得到的查询矩阵,Ks=csW'k是由风格特征cs和新添加的可训练的键权重W'k计算得到的键矩阵,Vs=csW'v是由风格特征cs和新添加的可训练的值权重W'v计算得到的值矩阵; 将原始交叉注意层的输出和新的交叉注意层的输出相加从而结合内容特征和风格特征,表达式为:Znew=Zc+Zs; 所述的通过训练集和损失函数对图像风格迁移模型进行训练,包括: a、将内容图像输入内容提取模块,内容提取模块提取内容图像的内容表示; b、将风格图像输入风格提取模块,风格提取模块提取风格图像的风格表示; c、将风格表示输入投影网络,投影网络将风格表示映射为与预训练扩散模型中的文本特征维度对齐的风格特征; d、将内容图像输入VAE编码器得到内容图像在潜在空间的图像表示,对内容图像的图像表示进行随机加噪处理获得后续扩散过程的初始潜在噪声; e、将内容表示、风格特征以及初始潜在噪声输入风格迁移模块的扩散模型中,模型对噪声进行预测; f、通过使用与原始扩散模型一样的损失函数,计算损失; g、根据所述损失,通过反向传播优化图像风格迁移模型的可训练参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。