Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 清华大学深圳国际研究生院李秀获国家专利权

清华大学深圳国际研究生院李秀获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉清华大学深圳国际研究生院申请的专利一种嵌入重构文本-图像对齐风格迁移的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119941492B

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510005224.X,技术领域涉及:G06T3/04;该发明授权一种嵌入重构文本-图像对齐风格迁移的方法是由李秀;黄妮莎设计研发完成,并于2025-01-02向国家知识产权局提交的专利申请。

一种嵌入重构文本-图像对齐风格迁移的方法在说明书摘要公布了:一种创新的嵌入重构文本‑图像对齐风格迁移方法,包括:构建基于扩散模型的基础架构,通过前向过程添加噪声并去噪以学习图像风格特征。利用感知器注意力和前馈网络从艺术品数据集中提取风格嵌入。通过文本编码器生成文本嵌入,为风格迁移提供指导。采用交叉注意力机制将风格嵌入与文本嵌入融合,生成多模态嵌入,优化文本与图像信息的交互。通过线性插值融合多模态嵌入与图像嵌入,并与文本嵌入拼接,形成完整的提示嵌入,整合到扩散模型中,生成与文本描述相匹配的风格图像。本发明的方法显著提升艺术图像风格迁移的质量和多样性,在艺术创作和设计领域具有广泛的应用潜力,能够提供丰富多样的风格化视觉成果,满足多元创作场景的需求。

本发明授权一种嵌入重构文本-图像对齐风格迁移的方法在权利要求书中公布了:1.一种嵌入重构文本-图像对齐风格迁移的方法,其特征在于,包括以下步骤: S1.基础模型构建:采用扩散模型作为基础架构,该模型通过前向过程向图像数据逐步添加噪声,模拟图像从清晰状态逐渐转变为完全噪声状态,随后通过去噪过程从噪声图像中恢复出原始图像,实现对图像风格特征的学习和编码; S2.基于注意力的风格提取:对于艺术品数据集中的参考图像,通过特征提取网络提取输入图像嵌入,用于捕捉图像的视觉特征;然后利用感知器注意力机制和前馈网络FFN进一步处理所述图像嵌入,从中捕获复杂的风格细节,生成风格嵌入; 步骤S2具体包括: 为参考图像生成初始的潜在变量,该变量被归一化以稳定训练过程; 将潜在变量扩展以匹配输入图像的批量大小,以便在处理多个图像时保持一致性; 通过感知器注意力机制更新潜在变量,使模型能够根据可学习的潜在变量有选择地关注输入图像的不同部分; 通过前馈网络FFN对更新后的潜在变量进行非线性变换,增强风格编码能力; 结合前馈网络的输出和更新后的潜在变量,生成代表输入图像风格的嵌入,用于后续的文本-图像对齐增强; S3.文本嵌入生成:通过文本编码器将文本描述转换为文本嵌入,用于指导风格迁移过程; S4.文本-图像对齐增强:将所述风格嵌入与所述文本嵌入通过交叉注意力机制进行融合,生成多模态嵌入,以优化文本与图像信息的交互; 步骤S4具体包括: 通过线性层将风格嵌入和文本嵌入分别转换为查询、键和值矩阵,以便在共享特征空间中进行交互; 利用查询矩阵和键矩阵的点积计算注意力权重,并通过缩放防止梯度消失,从而动态地优先考虑文本提示的不同方面; 对原始注意力分数应用softmax函数,获得归一化的注意力权重,确保权重之和为1,以便进行有效的信息整合; 使用归一化的注意力权重对值矩阵进行加权求和,生成多模态嵌入,该嵌入能够更有效地捕获文本和图像的多模态上下文; S5.显式调制与扩散模型整合:通过线性插值将所述多模态嵌入与所述风格嵌入进行融合,将融合后得到的图像嵌入与文本嵌入进行拼接,形成完整的提示嵌入,再将该提示嵌入整合到所述扩散模型中,生成与文本描述相匹配的多样化风格图像。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学深圳国际研究生院,其通讯地址为:518071 广东省深圳市南山区桃源街道丽水路2279号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。