Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 上海交通大学蒋兴浩获国家专利权

上海交通大学蒋兴浩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉上海交通大学申请的专利基于自然语言的图像修改与生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114140666B

龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111474605.0,技术领域涉及:G06T11/60;该发明授权基于自然语言的图像修改与生成方法是由蒋兴浩;唐致远;许可;孙锬锋设计研发完成,并于2021-12-06向国家知识产权局提交的专利申请。

基于自然语言的图像修改与生成方法在说明书摘要公布了:本发明提供了一种基于自然语言的图像修改与生成方法,包括:根据任务类型,基于输入的图像计算获取初始图像隐向量;输入目标文本信息,计算目标文本嵌入向量;输入目标文本,基于所述目标文本计算目标文本嵌入向量;设定不同目标生成策略,基于目标生成策略计算对应的图像生成预训练模型的层更新权重;依据输入图像计算初始图像隐向量、目标文本嵌入向量与层更新权重,对图像生成预训练模型的参数与图像隐向量进行训练调优,以得到更新后的合成图像的隐向量和图像生成预训练模型;基于更新后的合成图像的隐向量和图像生成预训练模型,得到并输出合成的目标图像。本发明填补了通过自然语言进行可精细化控制的图像修改或生成任务的空白,图像修改与生成效果好,能在较短时间内获取输出结果。

本发明授权基于自然语言的图像修改与生成方法在权利要求书中公布了:1.一种基于自然语言的图像修改与生成方法,其特征在于,包括如下步骤: 步骤S1,包括:步骤S1.1,获取用户输入,确定输入中是否存在图像;步骤S1.2,若步骤S1.1中判断为是,则当前任务为修改图像,使用图像编码器计算输入的图像对应的隐向量,将计算得到的隐向量作为初始图像隐向量;步骤S1.3,若步骤S1.1中判断为否,则当前任务为生成图像,在输入层的隐空间内随机采样隐向量作为初始图像隐向量; 步骤S2,输入目标文本,基于所述目标文本计算目标文本嵌入向量; 步骤S3,设定不同目标生成策略,基于目标生成策略计算对应的图像生成预训练模型的层更新权重;其中,所述步骤S3包括如下步骤:步骤S3.1,设定不同目标生成策略,所述目标生成策略包括自由度的设定,所述自由度的设定包括:形状自由度、纹理自由度和内容自由度的设定;步骤S3.2,根据设定的目标生成策略计算对应图像生成预训练模型的层更新权重,其中,所述层更新权重,用于决定所述图像生成预训练模型的各层的可训练度; 步骤S4,依据输入图像计算初始图像隐向量、目标文本嵌入向量与层更新权重生成策略,对图像生成预训练模型的参数与图像隐向量进行训练调优,以得到更新后的合成图像的隐向量和图像生成预训练模型;其中,所述步骤S4包括如下步骤:步骤S4.1,将初始图像隐向量输入图像生成预训练模型,获取输出的合成图像;步骤S4.2,将输出的合成图像输入预训练视觉嵌入模型,获取合成图像的嵌入向量;步骤S4.3,将合成图像的嵌入向量与目标文本嵌入向量,输入对比语言图像预训练模型,计算语义距离作为模型训练的对比损失值;步骤S4.4,将所述对比损失值反向传播到网络各节点,根据层更新权重缩放各节点损失值,再通过优化器更新合成图像的隐向量与图像生成预训练模型的参数; 步骤S5,基于更新后的合成图像的隐向量和图像生成预训练模型,得到并输出合成的目标图像。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海交通大学,其通讯地址为:200240 上海市闵行区东川路800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。