Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于多模态学习的影视配乐与音效匹配系统及方法,属于影视制作技术领域。该方法包括:通过视频分析模块提取影视内容的色彩、形状和运动特征;通过音频特征提取模块获取音频的节奏、旋律和情感特征;采用多模态学习模块融合视觉和音频特征,通...
  • 本发明涉及图像识别技术领域,具体涉及一种自动识别定位拍摄人体部位特征的方法,首先获取相机开启后的视频流,并对所述视频流进行抽帧,确定目标图像,然后通过预先建立的人体部位识别模型,按照特定的角度对目标图像中的人体特定部位进行识别,根据目标图像...
  • 一种全景直接偏好优化方法、评测基准数据构建方法及优化系统,属于人工智能中的视频理解技术领域。为了解决目前面向视频和问题的多模态大语言模型缺乏对时间维度考虑存在影响动态视频场景中的时序感知鲁棒性的问题。本发明通过将正常视频作为偏好视频,并通过...
  • 本申请提供了一种目标空间的监测方法、系统、电子设备及计算机程序产品,属于图像处理技术领域,以解决现有监测方法无法在目标空间的不同功能区域对监测对象及其行为影响进行精细化评估等问题。所述方法包括如下步骤:从所述目标空间采集视频数据,确定所述目...
  • 本申请提供了一种零样本多目标追踪方法及装置、电子设备、存储介质,属于目标追踪技术领域,该方法包括:获取连续的视频帧序列数据和语义查询数据;提取连续的视频帧序列数据的时空特征序列,以及将每个图文查询数据进行语义空间映射得到至少一个语义向量,基...
  • 本发明实施例提供一种单目标跟踪方法和装置,涉及目标跟踪技术领域,能够提高单目标跟踪的精确性和鲁棒性。本发明实施例的方法包括:在前帧图像中确定跟踪目标,在跟踪目标的周围背景区域内利用跟踪目标的语义特征提取周围背景区域的语义干扰信息进而创建语义...
  • 本发明公开一种基于YOLOv8的轨道交通工地多类别工程车识别装置、方法、设备及介质,包括:图像获取模块,被配置为获取轨道交通工地的可见光图像和红外图像;多模态特征增强模块,被配置为分别提取可见光图像的纹理结构特征与红外图像的温度分布特征,利...
  • 本发明公开了一种基于时序动态建模的AI生成视频来源归属方法以及系统,提出了一种新颖的TPDNet网络架构。该方法首先采用视觉编码器对输入的视频帧序列进行处理,在空间上将其分解为多个图像块,并提取每个图像块的深度特征;本发明通过独特的维度重排...
  • 本发明涉及异常行为检测技术领域,尤其涉及一种直播异常行为检测方法及系统。本发明的方法包括:获取待检测直播间的视频数据和音频数据;将音频数据输入训练好的人声判定模型中,得到第一分类结果;将视频数据输入训练好的目标检测模型中,得到第二分类结果;...
  • 本发明属于360度视频流传输与深度学习视口预测技术领域,具体提供一种基于空洞卷积与通道注意力机制的视口预测增强方法。针对现有视口预测模型在特征提取时存在的感受野受限、局部细节感知不足及全局上下文建模不充分等问题,本发明将空洞卷积与通道注意力...
  • 本发明涉及计算机视觉和边缘计算技术领域,公开了多算力协同的视频结构化分析方法,其中,多算力协同的视频结构化分析方法包括:获取多路原始视频流,对多路原始视频流进行同步解码;采用梯度分析质量评估解码后的多路原始视频流,基于质量特征向量选择预处理...
  • 本发明属于视频异常检测技术领域,具体涉及一种基于记忆引导的联邦弱监督视频异常检测方法,包括服务器向各客户端发送全局文本和初始的全局模型;所述全局模型包括时间建模模块、记忆模块、提示生成器和冻结的CLIP模型;客户端将当前收到的全局模型作为当...
  • 本申请提供了一种关键帧确定方法、电子设备、存储介质及计算机程序产品,其中,方法包括:将视频流中每个视频帧和所述视频流的音频进行特征融合,得到所述每个视频帧的多模态特征图;将第一文本与所述每个视频帧的多模态特征图进行注意力交互,得到所述视频流...
  • 本发明公开了一种基于昼夜双域渐进自适应与教师‑学生双流网络的全时段道路交通事故检测方法及系统,本发明提出了一种双流网络,包括外观网络和运动网络,其中外观网络通过粗到细的域适应方法进行训练,以捕获在不同时间段内有效的事故外观特征;该方法通过全...
  • 本发明涉及图像识别技术领域,公开了一种基于图像识别的水陆运输载具识别方法及系统。通过在码头部署工业相机网络实时获取多视角视频流,并进行动态场景预处理。采用分层注意力Transformer架构与三维卷积神经网络构建识别模型,提取时空特征,实现...
  • 本发明提供了基于AI视觉识别的建筑施工安全隐患实时监测系统,属于建筑施工安全监测与人工智能视觉识别交叉技术领域,系统包括:图像采集模块用于实时采集建筑施工现场的原始视频流;图像预处理模块用于对原始视频流进行处理;AI视觉分析模块用于基于预处...
  • 本发明公开一种海水悬沙浓度大面积实时视频测量方法,属于海洋监测技术领域。该方法先在观测海域部署视频监控系统,实时采集海水影像并传输至工作站;对影像逐帧提取后,经均值滤波、地理配准、太阳照度校正、多摄像头拼接等处理,消除干扰并形成完整面状影像...
  • 本发明公开了基于深度学习的输电线路机械化作业目标检测方法及设备,涉及图像检测技术领域,包括:对输入的视频流进行动态场景建模,提取前景运动目标区域和新出现的静态目标区域,合并生成候选感兴趣区域集合;对候选感兴趣区域集合内的区域,利用相邻帧的时...
  • 本申请涉及一种视频对象分割方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域。本申请能够提升视频对象分割的泛化性及准确性。方法:获取视频中各帧图像的目标对象的多模态信息,包括目标对象的语义属性信息、运动描述信息和检测框位置信息。根据...
  • 本发明公开了结合深度学习的视频目标跟踪系统及方法,涉及计算机视觉技术领域,包括以下步骤:获取各监控设备的视频帧序列数据;对所述视频帧序列数据的时间编码序列进行分段处理,得到相应监控设备的轨迹片段;提取任意两轨迹片段组成的轨迹片段对的时间编码...
技术分类