西北工业大学魏巍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种基于扩散模型的精细可控图像风格化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119762330B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411832365.0,技术领域涉及:G06T3/04;该发明授权一种基于扩散模型的精细可控图像风格化方法是由魏巍;付博文;张磊;聂江涛设计研发完成,并于2024-12-12向国家知识产权局提交的专利申请。
本一种基于扩散模型的精细可控图像风格化方法在说明书摘要公布了:本发明公开了一种基于扩散模型的精细可控图像风格化方法。该方法包括:获取训练数据,其中,训练数据为一组与拥有对齐风格属性的样本数据,样本数据包括内容图像、笔触图像、颜色图像、文本信息和目标图像;对内容图像、笔触图像和颜色图像隐式地进行特征解耦处理,得到内容属性特征、笔触属性特征和颜色属性特征;将内容属性特征、笔触属性特征、颜色属性特征和文本信息通过适应性门控机制融合并注入至可控扩散模型中,结合目标图像,得到预测图像。本发明解决了现有技术中未解耦参考图像中的多种细粒度的风格属性,造成难以精细、灵活地控制风格转移的技术问题。
本发明授权一种基于扩散模型的精细可控图像风格化方法在权利要求书中公布了:1.一种基于扩散模型的精细可控图像风格化方法,其特征在于,包括: 收集若干个内容、笔触和颜色词汇,构建词汇库; 基于词汇库中的内容和笔触词汇利用大语言模型的提示模板,生成图像的文字描述,基于图像的文字描述,利用文本到图像生成模型合成拥有多种笔触风格的图像; 基于多种笔触风格的图像生成canny边缘图; 结合颜色词汇和图像的文字描述构建可控扩散模型的文本信息,将文本信息和canny边缘图输入至ControlNet模型,得到拥有对齐笔触图像、颜色图像和内容图像以及文本信息的数据集; 抽取拥有对齐笔触图像、颜色图像和内容图像以及文本信息的数据集的一组作为训练数据,其中,训练数据为一组拥有对齐风格属性的样本数据,样本数据包括内容图像、笔触图像、颜色图像、文本信息和目标图像; 对内容图像、笔触图像和颜色图像隐式地进行特征解耦处理,得到内容属性特征、笔触属性特征和颜色属性特征; 将内容属性特征、笔触属性特征、颜色属性特征和文本信息通过适应性门控机制融合并注入至可控扩散模型中,结合目标图像,得到预测图像,包括:将文本信息与可控扩散模型中的每层交叉注意力层的噪声的潜在表示做交叉注意力,得到每一层的文本相关嵌入,其中,交叉注意力层包括粗糙层和精细层; 将内容属性特征与粗糙层的每层的噪声的潜在表示做交叉注意力,得到粗糙层的每一层的内容相关嵌入; 将笔触属性特征与精细层的每层的噪声的潜在表示做交叉注意力,得到精细层的每一层的笔触相关嵌入; 将颜色属性特征与精细层的每层的噪声的潜在表示做交叉注意力,得到精细层的每一层的颜色相关嵌入; 将每一层的文本相关嵌入融入可控扩散模型的所有交叉注意力层中、将粗糙层的每一层的内容相关嵌入融入粗糙层的每一层中、将精细层的每一层的笔触相关嵌入融入精细层的每一层中和将精细层的颜色相关嵌入融入精细层的每一层中进行引导,结合目标图像,得到预测图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市碑林区友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励