Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京邮电大学鲍秉坤获国家专利权

南京邮电大学鲍秉坤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京邮电大学申请的专利一种基于知识蒸馏的动态统一序列图像生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120876672B

龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511384220.3,技术领域涉及:G06T11/60;该发明授权一种基于知识蒸馏的动态统一序列图像生成方法是由鲍秉坤;游思思;徐梦玲设计研发完成,并于2025-09-26向国家知识产权局提交的专利申请。

一种基于知识蒸馏的动态统一序列图像生成方法在说明书摘要公布了:本发明属于图像生成领域,公开一种基于知识蒸馏的动态统一序列图像生成方法,包括以下步骤:输入多个类别的宫格图像和文本信息并分别进行编码处理,获得编码后宫格图像和文本特征;对编码后的宫格图像进行加噪,并与文本特征拼接后输入预训练的自回归扩散模型中;学习不同类别宫格图像的布局特征和帧间连贯性,并设计稀疏掩码策略微调预训练的自回归扩散模型,把多个类别的宫格图像特征蒸馏到一个统一的矩阵中,输出帧间连贯的宫格图像;从帧间连贯的宫格图像中随机选取两帧图像输入图像扩写模型中,对两帧图像进行动态位置编码;解决了现有技术中存在着序列生成灵活性不足,且难以保证逻辑与视觉连贯性的问题。

本发明授权一种基于知识蒸馏的动态统一序列图像生成方法在权利要求书中公布了:1.一种基于知识蒸馏的动态统一序列图像生成方法,其特征在于,包括以下步骤: 输入多个类别的宫格图像和文本信息并分别进行编码处理,获得编码后宫格图像和文本特征; 对编码后的宫格图像进行加噪,并与文本特征拼接后输入预训练的自回归扩散模型中; 学习不同类别宫格图像的布局特征和帧间连贯性,并设计稀疏掩码策略微调预训练的自回归扩散模型,把多个类别的宫格图像特征蒸馏到一个统一的矩阵中,输出帧间连贯的宫格图像; 从帧间连贯的宫格图像中随机选取两帧图像输入图像扩写模型中,对两帧图像进行动态位置编码,并用动态位置编码更新图像扩写模型中待输出图像的位置信息; 基于更新后的位置信息,微调图像扩写模型,生成所选取的两帧图像之间的中间图像特征,并由图像解码器解码输出动态统一序列图像; 学习不同类别宫格图像的布局特征和帧间连贯性,并设计稀疏掩码策略微调预训练的自回归扩散模型,把多个类别的宫格图像特征蒸馏到一个统一的矩阵中,输出帧间连贯的宫格图像,具体包括以下步骤: 采用卷积神经网络提取宫格图像中每帧图像的特征xi,; 构建完整的宫格图像特征矩阵,,其中n为帧数,d为特征维度; 在预训练的自回归扩散模型的自注意力层投影矩阵W上叠加可学习低秩矩阵,形成适配后的权重矩阵,具体表达式为: 其中,为缩放系数;B1、B2分别为针对四宫格图像和九宫格图像的可学习低秩矩阵;A为四宫格图像和九宫格图像共用的低秩矩阵的上矩阵; 确定低秩矩阵中参数,参数包括行范数、绝对值和; 计算各低秩矩阵中参数的重要性分数,具体计算式如下: 式中,表示低秩矩阵B1中参数的重要性分数;表示低秩矩阵B2中参数的重要性分数;表示低秩矩阵B1的第i行、第j列对应的值;表示低秩矩阵B2的第i行、第j列对应的值;r是矩阵的秩; 以低秩矩阵中行范数的重要性分数,分别对低秩矩阵B1和低秩矩阵B2中每一行进行排序; 预先设定稀疏率s,低秩矩阵B1和低秩矩阵B2中各自保留前k行,其中; 对其余行全部置零,并用掩码表示保留与否,形成稀疏化矩阵: 其中,表示掩码矩阵;⊙表示为Hadamard积;和分别为低秩矩阵B1和低秩矩阵B2所对应的稀疏化矩阵; 通过序列建模网络捕获帧间动态关系,具体表达式如下: 其中,表示第t帧的上下文特征;表示序列模型;表示第t‑1帧的上下文特征; 在微调的训练阶段,仅更新掩码保留的稀疏矩阵参数,通过梯度下降优化预训练的自回归扩散模型,将不同类别的图像特征蒸馏到稀疏后的矩阵中,输出帧间连贯的宫格图像; 从帧间连贯的宫格图像中随机选取两帧图像输入图像扩写模型中,对两帧图像进行动态位置编码,具体包括以下步骤: 从生成的帧间连贯的宫格图像中,通过滑动窗口机制随机选取两帧图像和; 对选定的两帧图像和分别生成时间位置编码,具体表达式如下: 其中,,表示图像帧序号; 采用预训练的视觉特征提取器提取两帧图像的内容特征,具体表达式如下: 其中,为视觉特征提取器;,分别为两个图像帧的内容特征; 将时间位置编码与对应内容特征融合生成动态位置编码,具体表达式如下: 其中,和表示特征拼接;表示多层感知机或线性变换;、分别为图像和动态位置编码,且。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210023 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。