博大视野(厦门)科技有限公司吴南海获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉博大视野(厦门)科技有限公司申请的专利基于3D时空网格感知的视频去模糊方法、介质和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120318118B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510802813.0,技术领域涉及:G06T5/73;该发明授权基于3D时空网格感知的视频去模糊方法、介质和设备是由吴南海;颜意民;陈玉明;翁渊彬;田设金;王传智设计研发完成,并于2025-06-16向国家知识产权局提交的专利申请。
本基于3D时空网格感知的视频去模糊方法、介质和设备在说明书摘要公布了:本发明公开一种基于3D时空网格感知的视频去模糊方法、介质和设备。该方法先接收连续N帧视频图像序列,以[N,H,W,3]为输入维度向量;通过相邻帧光流幅值计算晃动强度,将每帧图像自适应划分为S×S重叠网格块,提取像素位置对应网格块形成[N,S,S,3]序列。将网格块序列输入3D时空网络模型处理,输出去模糊网格块;再基于像素与相邻网格块中心距离计算融合权重,加权重组网格块,输出清晰当前帧图像。该方法利用3D时空网络与网格块处理,结合场景晃动特性,实现高效实时去模糊,可有效解决港口集装箱监控画面模糊问题,提升作业安全性。
本发明授权基于3D时空网格感知的视频去模糊方法、介质和设备在权利要求书中公布了:1.一种基于3D时空网格感知的视频去模糊方法,其特征在于,包括以下步骤: 接收连续N帧的视频图像序列,输入维度向量为[N,H,W,3],其中,N表示输入的视频图像帧数,H和W分别表示高度和宽度,3表示RGB通道; 通过相邻帧光流幅值计算晃动强度,将每帧视频图像自适应划分为大小为S×S的重叠网格块,对每个视频图像中的像素位置i,j,从N帧视频图像中提取该像素位置对应的网格块,形成形状为[N,S,S,3]的网格块序列,其中,N为大于1的正整数,N-1帧为清晰帧图像,第N帧图像为需要进行去模糊处理的当前帧图像; 将网格块序列输入训练完成的3D时空网络模型中进行块处理,输出去模糊处理后的网格块; 基于像素位置与相邻网格块中心距离计算融合权重,对所述去模糊处理后的网格块进行加权融合重组,输出清晰的当前帧图像; 所述3D时空网络模型包括模型生成器,所述模型生成器包括: 3D时空特征提取模块,将输入的[N,S,S,3]网格块序列转换为[1,3,N,S,S]维度以适配3D卷积输入,其中,1表示批次大小,表示输入一个多帧序列; 晃动感知编码器,通过三层下采样卷积提取多尺度特征,输出保存至跳跃连接层; 残差块模块,串联6个残差块,每个残差块包含两个3×3卷积层及恒等跳跃连接; 时空上下文解码器,通过反卷积上采样,并利用跳跃连接获取晃动感知编码器的多尺度特征; 细节增强输出层,通过3×3卷积将特征通道从64降为3,经Tanh激活函数输出范围[-1,1]的RGB图像; 所述3D时空网络模型包括模型判别器,所述模型判别器包括: 3D时空特征感知模块,将网格块序列与生成器输出图像组合为形状[1,3,N+1,S,S]的张量,应用卷积核大小为N+1,4,4、步长1,2,2的3D卷积,输出形状[1,64,S2,S2]的特征图,其中S为网格块尺寸且为偶数; 2D块GAN判别链,对特征图进行多层卷积下采样,输出真假程度特征图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人博大视野(厦门)科技有限公司,其通讯地址为:361000 福建省厦门市厦门火炬高新区软件园二期观日路34号403室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。