青岛理工大学李晓静获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉青岛理工大学申请的专利一种用于视觉目标跟踪的时空一致性数据生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121527140B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610063167.5,技术领域涉及:G06T7/246;该发明授权一种用于视觉目标跟踪的时空一致性数据生成方法是由李晓静;鲁涛;杜鹏程;张峰硕;陈彤设计研发完成,并于2026-01-19向国家知识产权局提交的专利申请。
本一种用于视觉目标跟踪的时空一致性数据生成方法在说明书摘要公布了:本发明涉及计算机视觉技术领域,特别涉及一种用于视觉目标跟踪的时空一致性数据生成方法。本发明首先,通过在目标跟踪训练集上训练路径生成器,利用光流估计与条件变分编码技术学习目标在时间序列中的运动规律,生成符合物理约束的目标运动轨迹。之后,基于生成的目标轨迹,引入时空一致性注意力机制对文本—视频生成模型进行引导,在保持基础模型参数冻结的情况下,通过注意力网络约束目标在生成帧中的位置、尺度与连续性,从而合成具有真实运动特征的视频帧序列。本发明生成具有真实运动特性和高时序一致性的目标跟踪视频数据,能够在不同场景下提升模型对复杂运动、光照变化及遮挡条件的鲁棒性。
本发明授权一种用于视觉目标跟踪的时空一致性数据生成方法在权利要求书中公布了:1.一种用于视觉目标跟踪的时空一致性数据生成方法,其特征在于,包括以下步骤: 步骤1、目标路径生成 利用条件变分自编码器VAE结合光流一致性约束生成目标运动轨迹;利用条件变分自编码器VAE结合光流一致性约束生成目标运动轨迹过程如下: 训练阶段,输入连续视频帧序列及对应目标位置,通过光流估计网络RAFT提取相邻帧间的稠密光流场,输出每个像素在相邻帧之间的二维位移向量; 随后,将跟踪位置轨迹和光流场输出组合后输入到条件变分编码器中进行路径分析:路径编码器将跟踪位置轨迹和光流场投影到潜在空间,生成潜在变量的运动分布参数,解码器在光流条件下生成下一帧预测轨迹,随后,路径解码器以潜在变量与光流环境条件为输入,重建或预测未来轨迹; 训练中采用轨迹重构损失、光流一致性损失及尺度归一化损失约束生成轨迹的空间精度、运动方向及目标框尺寸; 推理阶段,输入目标初始位置与类别描述,结合历史光流递归预测未来轨迹,得到完整运动路径; 步骤2、基于时空一致性约束的视频帧生成 在冻结文本-视频生成模型参数的条件下,引入目标运动注意力模块修正时空混合注意力;空间上,根据目标框构建高斯掩码突出前景区域;时间上结合帧间距离调整权重,得到时空注意力,使用2D高斯以box中心与尺寸形成空间掩码;之后基于时空注意力修正原注意,训练中通过内容一致性损失与运动一致性损失保证生成帧间视觉和运动连续性; 步骤3、生成目标运动视频 推理阶段,将步骤1生成的运动轨迹及类别文本输入步骤2引入基于注意力的时空一致性图像生成引导机制的文本-视频生成模型,输出具有高空间精度、时序连贯性的目标运动视频,实现目标跟踪数据生成; 基于注意力的时空一致性图像生成引导机制构建过程如下: 首先构建面向目标跟踪数据生成的文本-视频模型,采用ModelScopeT2V作为基础文本-视频模型用于生成跟踪图像数据,文本编码器用于将输入文本映射为语义表示,VQGAN用于将潜在空间映射为图像视频帧以及去噪UNet实现在潜在空间上执行带时间维度的扩散还原操作;UNet中包含时空混合注意力以及文本条件的交叉注意力;基于注意力的时空一致性图像生成引导机制用于修正时空混合注意力在目标跟踪数据生成的不足,使得在保持原有文本-视频模型结构不变、参数冻结的基础上,新的目标运动注意力对时空混合注意力进行修正,从而在生成时对目标出现、移动、变尺度保持更高时序一致性与位置尺寸精准度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人青岛理工大学,其通讯地址为:266000 山东省青岛市黄岛区嘉陵江东路777号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励