Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于时序动态建模的AI生成视频来源归属方法以及系统,提出了一种新颖的TPDNet网络架构。该方法首先采用视觉编码器对输入的视频帧序列进行处理,在空间上将其分解为多个图像块,并提取每个图像块的深度特征;本发明通过独特的维度重排...
  • 本发明涉及异常行为检测技术领域,尤其涉及一种直播异常行为检测方法及系统。本发明的方法包括:获取待检测直播间的视频数据和音频数据;将音频数据输入训练好的人声判定模型中,得到第一分类结果;将视频数据输入训练好的目标检测模型中,得到第二分类结果;...
  • 本发明属于360度视频流传输与深度学习视口预测技术领域,具体提供一种基于空洞卷积与通道注意力机制的视口预测增强方法。针对现有视口预测模型在特征提取时存在的感受野受限、局部细节感知不足及全局上下文建模不充分等问题,本发明将空洞卷积与通道注意力...
  • 本发明涉及计算机视觉和边缘计算技术领域,公开了多算力协同的视频结构化分析方法,其中,多算力协同的视频结构化分析方法包括:获取多路原始视频流,对多路原始视频流进行同步解码;采用梯度分析质量评估解码后的多路原始视频流,基于质量特征向量选择预处理...
  • 本发明属于视频异常检测技术领域,具体涉及一种基于记忆引导的联邦弱监督视频异常检测方法,包括服务器向各客户端发送全局文本和初始的全局模型;所述全局模型包括时间建模模块、记忆模块、提示生成器和冻结的CLIP模型;客户端将当前收到的全局模型作为当...
  • 本申请提供了一种关键帧确定方法、电子设备、存储介质及计算机程序产品,其中,方法包括:将视频流中每个视频帧和所述视频流的音频进行特征融合,得到所述每个视频帧的多模态特征图;将第一文本与所述每个视频帧的多模态特征图进行注意力交互,得到所述视频流...
  • 本发明公开了一种基于昼夜双域渐进自适应与教师‑学生双流网络的全时段道路交通事故检测方法及系统,本发明提出了一种双流网络,包括外观网络和运动网络,其中外观网络通过粗到细的域适应方法进行训练,以捕获在不同时间段内有效的事故外观特征;该方法通过全...
  • 本发明涉及图像识别技术领域,公开了一种基于图像识别的水陆运输载具识别方法及系统。通过在码头部署工业相机网络实时获取多视角视频流,并进行动态场景预处理。采用分层注意力Transformer架构与三维卷积神经网络构建识别模型,提取时空特征,实现...
  • 本发明提供了基于AI视觉识别的建筑施工安全隐患实时监测系统,属于建筑施工安全监测与人工智能视觉识别交叉技术领域,系统包括:图像采集模块用于实时采集建筑施工现场的原始视频流;图像预处理模块用于对原始视频流进行处理;AI视觉分析模块用于基于预处...
  • 本发明公开一种海水悬沙浓度大面积实时视频测量方法,属于海洋监测技术领域。该方法先在观测海域部署视频监控系统,实时采集海水影像并传输至工作站;对影像逐帧提取后,经均值滤波、地理配准、太阳照度校正、多摄像头拼接等处理,消除干扰并形成完整面状影像...
  • 本发明公开了基于深度学习的输电线路机械化作业目标检测方法及设备,涉及图像检测技术领域,包括:对输入的视频流进行动态场景建模,提取前景运动目标区域和新出现的静态目标区域,合并生成候选感兴趣区域集合;对候选感兴趣区域集合内的区域,利用相邻帧的时...
  • 本申请涉及一种视频对象分割方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域。本申请能够提升视频对象分割的泛化性及准确性。方法:获取视频中各帧图像的目标对象的多模态信息,包括目标对象的语义属性信息、运动描述信息和检测框位置信息。根据...
  • 本发明公开了结合深度学习的视频目标跟踪系统及方法,涉及计算机视觉技术领域,包括以下步骤:获取各监控设备的视频帧序列数据;对所述视频帧序列数据的时间编码序列进行分段处理,得到相应监控设备的轨迹片段;提取任意两轨迹片段组成的轨迹片段对的时间编码...
  • 本发明公开了一种基于多重滤波与光流技术的实时交通事故检测方法,涉及交通事故自动检测技术领域。本发明的降噪效果更优,图像质量显著提升,区别于现有技术单一滤波的降噪方式,采用高斯滤波与非局部均值滤波构建两级多重噪体系,实现对高斯噪声、随机噪声的...
  • 本发明涉及一种IPTV视频质量增强方法及系统,涉及视频质量技术领域,包括以下步骤,对IPTV视频流进行帧间分离,得到视频帧序列及帧间时序特征;基于所述帧间时序特征对所述视频帧序列进行自适应色域映射,得到色彩重构序列数据;对所述色彩重构序列数...
  • 本申请属于计算机视觉技术领域,具体公开了一种基于改进端到端网络的教师原子动作识别方法及装置。通过本申请,基于改进的目标端到端网络,根据目标教师的当前授课视频确定时间维度视频特征和空间维度视频特征,并在生成多窗口特征分组后,通过帧选择网络对多...
  • 本发明涉及一种通用视觉模型训练方法及系统,属于计算机视觉技术领域,方法步骤包括:获取待检测视频样本,利用主干网络提取视频序列中连续多帧图像的多层次多尺度特征;基于相邻帧的特征,通过光流预测网络预测从待检测帧到目标帧的光流场;利用待检测帧和目...
  • 本发明公开了一种基于语义句库与相似度时序建模的视频感知特征提取方法,该方法利用视频语言模型和大语言模型获得针对视频片段的不同感知维度的语义句库,将不同感知维度的语义句库与视频片段进行相似度比较得到在每个感知维度下每个视频帧与每个语义句的相似...
  • 本申请实施例公开了一种数据处理方法,应用于人工智能领域,包括:获取图像;通过目标网络,得到图像的目标特征信息,目标特征信息为第一特征信息和第二特征信息的融合结果,第一特征信息是由第一子网络对图像进行目标特征提取得到的,第二特征信息是由第二子...
  • 本发明公开了基于无人艇多模态信息融合的落水人员危险性评估方法。该方法通过视觉、红外、声音与环境多通道协同感知,利用集成选择性对比度受限自适应直方图均衡化、可变核卷积及区域加权机制的单阶段深度目标检测网络,实现水面目标的快速检测与精确识别;采...
技术分类