当前位置 : 首页 > 专利喜报 > 北京交通大学郎丛妍获国家专利权

北京交通大学郎丛妍获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉北京交通大学申请的专利文本生成图像模型训练方法、系统以及文本生成图像方法、系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN117058673B 。

龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310738750.8，技术领域涉及：G06V20/70；该发明授权文本生成图像模型训练方法、系统以及文本生成图像方法、系统是由郎丛妍;薛志杭;王振学;李浥东设计研发完成，并于2023-06-21向国家知识产权局提交的专利申请。

本文本生成图像模型训练方法、系统以及文本生成图像方法、系统在说明书摘要公布了：本发明提供一种文本生成图像模型训练方法、系统以及文本生成图像方法、系统，属于计算机视觉及人工智能技术领域，将文本描述输入到预训练的文本编码器中，提取得到全局句子特征和单词特征矩阵，随机采样的噪音特征与句子特征连接，输入生成网络，在第一个生成模块中提取低尺度视觉文本特征。图像特征与视觉文本特征跨尺度通道激活模块得到加强的图像特征，按次序分别传入生成器中，得到生成图像。本发明基于跨尺度通道激活模块的生成网络将含有丰富全局语义信息的低尺度视觉文本特征与图像特征融合，避免最终图像生成质量过度依赖于初始图像的生成结果；通过对困难样本添加惩罚性权重，使判别网络关注于对困难样本的学习，实现对困难样本的挖掘。

本发明授权文本生成图像模型训练方法、系统以及文本生成图像方法、系统在权利要求书中公布了：1.一种文本生成图像模型训练方法，其特征在于，包括：获取训练数据；所述训练数据包括多组数据，每一组数据均包括文本描述信息和自然图像的匹配对，以及标注所述自然图像中与所述文本描述信息匹配的标签；利用获取的训练数据训练网络模型，得到训练好的文本生成图像模型；其中，所述网络模型包括文本编码器、图像编码器、生成网络以及自适应判别网络；所述文本编码器用于提取所述文本描述信息的全局句子特征和单词特征矩阵；所述图像编码器用于提取所述自然图像的图像全局特征，以及提取所述生成网络生成的生成图像的图像全局特征；所述生成网络用于基于全局句子特征和单词特征矩阵得到图像特征，并基于图像特征得到所述生成图像以及融合图像特征获取所述生成图像；所述自适应判别网络用于基于自然图像的图像全局特征和生成图像的图像全局特征，判别生成图像的真伪以及生成图像的内容与文本描述是否一致；其中，生成网络中包括跨尺度通道激活模块利用全局句子特征中视觉文本特征的全局信息对图像特征进行增强，得到表征能力更强的融合图像特征；其中，所述生成网络包括多个级联的图像特征生成器，每一个图像特征生成器连接有一个图像生成器；第一个图像特征生成器用于提取全局句子特征中的低尺度视觉文本特征并生成第一图像特征，第一个图像生成器用于基于第一图像特征生成第一生成图像；之后的每一个图像特征生成器用于基于前一个图像特征生成器生成的图像特征和单词特征矩阵生成高尺度图像特征，且与各自对应的图像生成器之间连接有所述跨尺度通道激活模块，跨尺度通道激活模块将各自对应的图像特征生成器生成的高尺度图像特征和低尺度视觉文本特征进行融合，得到所述融合图像特征。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人北京交通大学，其通讯地址为：100044 北京市海淀区西直门外上园村3号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

北京交通大学郎丛妍获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务