当前位置 : 首页 > 专利喜报 > 杭州电子科技大学顾晓玲获国家专利权

杭州电子科技大学顾晓玲获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉杭州电子科技大学申请的专利一种基于交叉注意力重分配的多实例可控图像生成方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN118628611B 。

龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202410772782.4，技术领域涉及：G06T11/20；该发明授权一种基于交叉注意力重分配的多实例可控图像生成方法是由顾晓玲;罗羚玮;吴圣琪;匡振中;吴子朝;俞俊设计研发完成，并于2024-06-17向国家知识产权局提交的专利申请。

本一种基于交叉注意力重分配的多实例可控图像生成方法在说明书摘要公布了：本发明公开了一种基于交叉注意力重分配的多实例可控图像生成方法，首先构建ChatGPT代码提示链CoC。然后在ChatGPT中使用代码提示链，生成符合多实例文本提示生成任务中所需要的布局。然后在扩散模型每一个时间步中获得交叉注意力图，并基于布局信息，获得两个引导损失。最后使用损失引导修改当前时间步上的预测噪声，迭代优化的噪声图像最终通过解码器得到生成的多实例可控图像。本发明缓解实体缺失、属性互换、属性泄露、空间布局错误等问题的出现，在图像编辑、个性化生成和虚拟试衣等领域中实现更准确、高质量的图像生成和修改，为用户提供更符合个性化需求的服务。

本发明授权一种基于交叉注意力重分配的多实例可控图像生成方法在权利要求书中公布了：1.一种基于交叉注意力重分配的多实例可控图像生成方法，其特征在于，其步骤如下：步骤1、构建ChatGPT代码提示链CoC；步骤2、在ChatGPT中使用代码提示链，在给定的多实例文本提示下生成布局生成任务中所需要的布局；步骤3、在扩散模型每一个时间步中获得交叉注意力图，并基于布局信息，获得两个引导损失；所述获得交叉注意力图具体过程如下：在扩散模型每一个时间步中获得交叉注意力图，是在公开的SD模型上使用；SD模型是在一个自编码器的潜在空间内运行；编码器ε·被训练将图像x转换为潜在空间编码z＝εx；解码器D·学习从潜在代码中重建图像，目标是达到Dεx≈x；然后在潜在空间中训练条件扩散模型∈θ·，根据给定的多实例文本提示P使用CLIP文本编码器生成潜在文本嵌入编码τθP；在扩散模型的训练过程中，采用均方重建损失：其中，∈来自标准正态分布N0,1，t为时间步长，zt为时间t时的潜在变量，τθ·为预先训练好的CLIP文本编码器；在推理过程中，将随机高斯噪声zt迭代去噪为z0，通过解码器获得最终图像为x′＝Dz0；在该过程中将文本信息集成到图像合成过程中，文本嵌入特征fp从预先训练好的CLIP文本编码器中得到，Nk表示标记数，Ne表示嵌入维度；关键字值和值由fp通过投影层生成；给定一组查询从分辨率为h×w的特征图中计算得出，交叉注意图定义为： Nq＝h×w和d表示键和查询值的输出维度，在去噪时间步t时，通过重塑和索引A，得到Ai∈[0,1]h′×w′，表示一个主题i与特征图中每个空间位置之间的交叉注意图；获得原始的交叉注意力图之后，经过高斯平滑函数GaussianSmoothing，再进行下一步操作，行损失计算的注意力图经过如下所示函数： A←GaussianSmoothingA 步骤4、使用损失引导修改当前时间步上的预测噪声，迭代优化后的噪声图像，最终通过解码器得到生成的多实例可控图像。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人杭州电子科技大学，其通讯地址为：310018 浙江省杭州市钱塘区白杨街道2号大街1158号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

杭州电子科技大学顾晓玲获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务