Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国石油大学(华东)刘畅获国家专利权

中国石油大学(华东)刘畅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国石油大学(华东)申请的专利一种基于解耦和多域引导策略的多条件引导的文本生成图像方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120047565B

龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510160176.1,技术领域涉及:G06T11/60;该发明授权一种基于解耦和多域引导策略的多条件引导的文本生成图像方法是由刘畅;邵明文;吕响;孟令壮;宫正义设计研发完成,并于2025-02-13向国家知识产权局提交的专利申请。

一种基于解耦和多域引导策略的多条件引导的文本生成图像方法在说明书摘要公布了:本发明提出一种基于解耦和多域引导策略的多条件引导的文本生成图像方法。该方法能够根据文本和任意的空间条件生成一张同时满足文本描述和空间对齐的图像。具体来说,该发明解耦了图像生成过程中结构表示和外观表示,并设计了两个独立的引导分支:外观引导分支和结构引导分支。这两个分支通过分类器引导策略,引导生成过程朝着精准的表达文本中的外观内容的同时,与引导分支的输入结构高度对齐。另外,为了实现更好的结构一致性,本方法提出了一种多域引导策略,联合了空间域和频域实现更加全面的结构监督。本方法不仅能够实现任意空间条件引导的文本生成图像,还能够即插即用到各种生成式模型中,能够完成常见的下游任务,如:图像去模糊、图像上色、图像修复和图像编辑等。

本发明授权一种基于解耦和多域引导策略的多条件引导的文本生成图像方法在权利要求书中公布了:1.一种基于解耦和多域引导策略的多条件引导的文本生成图像方法,其特征在于解耦外观和结构的生成,并且联合了空域和频域的多域引导实现外观一致性,包括以下步骤: S1,构建预训练的稳定扩散模型作为生成分支,并且初始化一个随机噪声;将用户文本和随机噪声输入到生成模型中,进行扩散生成;提取扩散生成过程中的自注意力层的三个分量:查询Q、键K和值V,并根据查询Q和键K获得生成过程中的自注意力图; S2,构建外观引导分支,加载预训练的稳定扩散模型,并将生成模型中初始化的随机噪声复制,作为外观引导分支的初始噪声,与用户文本一同输入到外观引导分支,进行扩散过程;提取外观引导过程中的自注意力层的值; S3,构建结构引导分支,加载预训练的稳定扩散模型;将结构控制条件通过去噪扩散隐式模型反演方法得到与条件相关的噪声,输入到稳定扩散模型中;提取结构引导过程中的自注意力层的查询和键,得到结构引导分支的自注意力图; S4,利用主成分提取技术提取生成过程中自注意力图和值的主成分,分别作为生成分支的结构表示和外观表示;同时,利用主成分提取技术提取外观引导分支值的主成分作为外观引导表示,利用主成分提取技术提取结构引导分支自注意力图的主成分作为结构引导表示;将生成分支和结构引导分支的结构引导表示通过小波变换提取四个频段特征,将四个频段中与高频相关的特征相加得到频域结构表示; S5,计算并求和外观监督损失、空域结构监督损失和频域结构监督损失;总损失通过梯度传播的方式惩罚和更新生成分支的隐特征,进行后续的去噪,直到迭代步为0,利用图像解码器将其恢复到像素空间,得到最终生成的图像。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国石油大学(华东),其通讯地址为:266580 山东省青岛市黄岛区长江西路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。