广东工业大学施煜锴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东工业大学申请的专利一种基于扩散模型的人脸照片转素描生成模型训练方法、生成方法、系统及计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119131218B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411012564.7,技术领域涉及:G06T15/02;该发明授权一种基于扩散模型的人脸照片转素描生成模型训练方法、生成方法、系统及计算机可读存储介质是由施煜锴;吴寒;林育培;卢永毅;杨志景设计研发完成,并于2024-07-25向国家知识产权局提交的专利申请。
本一种基于扩散模型的人脸照片转素描生成模型训练方法、生成方法、系统及计算机可读存储介质在说明书摘要公布了:本发明公开了一种基于扩散模型的人脸照片转素描生成模型训练方法。包括以下步骤:初始化扩散模型,获取样本对数据集,选用其中一对样本作为训练集,其余作为测试集;利用训练集、文本指令在扩散模型上进行图像重建,过程中训练文本指令;利用所述训练后的文本指令与训练集一同输入到扩散模型中重复上述文本训练过程,直到训练次数达到训练次数阈值时,输出文本指令;利用扩散模型和优化过的文本指令将测试集的人脸照片转化成人脸素描画像,测试过程中可以把额外信息嵌入到所述优化过的文本指令中。本发明仅用一组素描样本对模型进行训练,生成素描与原图像保持极高相似度,算法运行速度大幅加快,大幅节省训练成本,且可适应不同风格作画。
本发明授权一种基于扩散模型的人脸照片转素描生成模型训练方法、生成方法、系统及计算机可读存储介质在权利要求书中公布了:1.一种基于扩散模型的人脸照片转素描生成模型训练方法,其特征在于,包括如下步骤: 初始化预训练的扩散模型的时间步、训练次数阈值和文本指令,获取人脸照片及其素描画像组成样本对数据集,仅用其中一对样本作为训练集,其余作为测试集; 利用所述训练集、文本指令在预训练的扩散模型上进行图像重建过程,过程中使用预设策略训练文本指令,得到训练后的文本指令; 利用所述训练后的文本指令作为输入,与训练集一同输入到所述扩散模型中重复上述文本训练过程,直到训练次数达到训练次数阈值时,输出优化过的文本指令; 利用所述扩散模型和优化过的文本指令将测试集的人脸照片转化成人脸素描画像,测试过程中把额外信息嵌入到所述优化过的文本指令中,标记所述的额外信息为需要特别关注的部分以更加灵活地控制输出的效果; 其中,所述预设策略是通过利用图像重建策略和利用CLIP确定的编辑方向进行训练的策略相结合,利用两种策略的总损失函数结合梯度下降算法来对文本指令进行训练,文本指令梯度下降算法的公式为: 式中,表示学习率,是损失函数关于的梯度; 所述图像重建策略具体方法是:对素描样本对{x,y}进行编码获得潜在变量和,其中,x为人脸图像,y为x对应的素描图像; 对在时间步t下进行加噪,将图片逐步变成噪声图片; 将文本指令,,时间步t,所述噪声图片输入至预训练的去噪网络,在时间步t下进行去噪,得到去噪变量; 过程中通过损失函数不断优化文本指令,损失函数的公式为: 其中,为编码器,为高斯噪声,为去噪网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510080 广东省广州市越秀区东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励