Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 厦门大学纪荣嵘获国家专利权

厦门大学纪荣嵘获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉厦门大学申请的专利一种基于文本指导的图像编辑方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119516038B

龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411392299.X,技术领域涉及:G06T11/60;该发明授权一种基于文本指导的图像编辑方法、装置、设备和介质是由纪荣嵘;蒋鹏飞;晁飞;林明宝设计研发完成,并于2024-10-08向国家知识产权局提交的专利申请。

一种基于文本指导的图像编辑方法、装置、设备和介质在说明书摘要公布了:本发明提供一种基于文本指导的图像编辑方法、装置、设备和介质,将输入图片、源提示词和目标提示词输入到模型;输入图片首先经过inversion过程被加噪为噪声图片,然后分别进入重建分支和编辑分支,所述重建分支的重建过程的交叉注意力图会注入到编辑分支中以保持图片的结构与内容;在inversion过程采用对比注意力聚焦策略,对于不同程度的注意力泄漏情况适应性地将注意力精准的引导至编辑区域;随后在编辑分支中使用掩膜引导的混合采样技术,为编辑区域和非编辑区域提供不同的条件指导,以保证图像中变化和保留的平衡整合在编辑过程中仅对需要编辑的区域进行修改,阻止对非编辑区域产生不必要的编辑,防止发生过度编辑的现象。

本发明授权一种基于文本指导的图像编辑方法、装置、设备和介质在权利要求书中公布了:1.一种基于文本指导的图像编辑方法,其特征在于:将输入图片、源提示词和目标提示词输入到文生图扩散模型;所述源提示词用于描述原图片的内容,所述目标提示词用于描述原图片编辑后的内容; 所述输入图片首先经过inversion过程被加噪为噪声图片,然后分别进入重建分支和编辑分支,所述重建分支用于重建输入图像,所述编辑分支用于编辑输入图像;所述重建分支的重建过程的交叉注意力图会注入到编辑分支中以保持图片的结构与内容; 所述inversion过程采用对比注意力聚焦策略,对于不同程度的注意力泄漏情况适应性地将注意力精准的引导至编辑区域;随后所述编辑分支中使用掩膜引导的混合采样技术,为编辑区域和非编辑区域提供不同的条件指导,以保证图像中变化和保留的平衡整合; 在所述inversion过程中通过平均反演过程中的所有头部和时间步的分辨率为16*16的注意力图来获得所需的交叉注意力图和自注意力图;增强编辑区域和发生注意力泄漏的区域之间的对比度: 首先对现有的交叉注意力图应用最小-最大归一化以生成缩放图s,缩放图s中的每个元素表示中相应元素的大小程度: 1 公式1用于将交叉注意力图映射到区间;指交叉注意力图对应矩阵的左端点,指交叉注意力图对应矩阵的右端点,通过将交叉注意力图与缩放图s相乘,放大交叉注意力图响应值之间的对比度; 执行次对比度增强操作,同时在每次操作后进行归一化操作以恢复原始数值大小: 2 其中,指当前执行的对比度增强操作次数,=1~N,,通过文本嵌入之间的余弦相似度确定: 3 其中,是参考文本嵌入,而表示其他文本嵌入,是总的文本token的数量,调整对相似度的敏感程度; 交叉注意力图执行次对比度增强操作后记为; 利用自注意力图的特性来恢复中的高响应区域的形状,以与编辑区域的形状保持一致;对和自注意力图进行矩阵乘法,得到: 4 在执行完公式4的操作后,的高响应区域涵盖了编辑区域,但也略微增加了对非编辑区域的关注; 随后,对进行注意力增强操作: 5 其中,表示迭代交叉注意图中的每个元素;表示阈值,根据经验设置; 进行注意力增强操作后,实现将低于的注意力值置零,并进一步增强高于的注意值; 所述使用掩膜引导的混合采样技术,为编辑区域和非编辑区域提供不同的条件指导具体是: 将编辑分支潜在代码的非编辑区域用重建分支潜在代码的相应非编辑区域进行替换: 6 其中,表示编辑区域的掩膜, 鉴于的高响应区域准确地包含了编辑区域,利用阈值中提取出掩模: 7 其中,根据经验设置; 掩膜指导的混合采样提供了针对编辑区域和非编辑区域量身定制的不同条件指导;确保编辑区域遵循目标提示,同时保持非编辑区域为原始状态: 8 其中,和分别表示源提示词和目标提示词的文本嵌入;和分别表示应用于非编辑区域和编辑区域的条件指导的强度,表示编辑区域的掩膜。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361000 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。