Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及流媒体处理的技术领域,公开了一种基于语义的流媒体智能切分方法及系统,包括对输入的流媒体数据进行预处理,进行深度神经网络模型的训练,使用验证集验证模型性能,系统自动调用训练好的模型对用户上传的流媒体数据进行语义切分。本申请通过捕捉到...
  • 基于动态提示调优的弱监督群体行为识别方法属于视频理解领域。该方法针对视频中群体行为语义复杂、时空上下文依赖性强和缺少个体标注等挑战,将预训练视觉‑语言模型适配扩展至群体行为识别任务。提出了一种视觉条件化的动态提示生成技术,能够依据输入视频内...
  • 本发明公开了一种电力变压器检测作业安全防护识别方法、系统及存储介质,包括获取检测作业环境的视频帧;识别视频帧中的围栏、实验区域、绝缘毯区域、作业人员的人体区域及脚踝关键点,变压器布置于实验区域内;根据实验区域与围栏的相对位置关系,计算变压器...
  • 本发明公开了基于视觉识别的球房纠纷事件预警系统,本发明涉及纠纷事件预警系统技术领域,包括准备组件、处理组件、计算组件和预警组件,其中计算组件包括冲突预估单元、环境风险单元和纠纷预警单元。本发明计算的冲突前兆强度指数由关节运动异常速度、负面表...
  • 本发明公开了一种叉车作业的安全预警方法、装置、设备和存储介质,包括:获取叉车作业现场的视频数据以及若干个拍摄设备对应的定位信息;将所述视频数据输入到预设的语义分割模型进行分割,得到若干个叉架区域和若干个车身区域,并分别从各所述叉架区域和各所...
  • 本发明公开了一种电网施工人员的安全预警方法、系统、设备及介质,其特征在于,包括:获取电网施工现场中若干个施工人员的视频序列;将所述视频序列中的各图像帧输入至预设的识别模型,得到安全帽候选框和工作服候选框,基于所述安全帽候选框和所述工作服候选...
  • 本发明将待评价的完整视频划分为多个长度相同的视频片段,通过计算视频片段中静态帧、全局动态帧和局部动态帧的占比,将视频片段定义为静态主导片段、物体运动主导片段和相机运动主导片段;分别提取每类片段并拼接组成对应片段集合,对片段集合进行预处理后输...
  • 本发明公开一种基于时空关联分析的智能家居监控系统,包括:多目标动态标记模块、用户自定义关注系统、智能时空探索引擎模块、因果推理引擎模块以及自动化报告生成模块;所述多目标动态标记模块用于从视频流中提取结构化目标信息,对检测到的目标赋予唯一标识...
  • 本发明公开了一种基于多模态学习的影视配乐与音效匹配系统及方法,属于影视制作技术领域。该方法包括:通过视频分析模块提取影视内容的色彩、形状和运动特征;通过音频特征提取模块获取音频的节奏、旋律和情感特征;采用多模态学习模块融合视觉和音频特征,通...
  • 本发明涉及图像识别技术领域,具体涉及一种自动识别定位拍摄人体部位特征的方法,首先获取相机开启后的视频流,并对所述视频流进行抽帧,确定目标图像,然后通过预先建立的人体部位识别模型,按照特定的角度对目标图像中的人体特定部位进行识别,根据目标图像...
  • 一种全景直接偏好优化方法、评测基准数据构建方法及优化系统,属于人工智能中的视频理解技术领域。为了解决目前面向视频和问题的多模态大语言模型缺乏对时间维度考虑存在影响动态视频场景中的时序感知鲁棒性的问题。本发明通过将正常视频作为偏好视频,并通过...
  • 本申请提供了一种目标空间的监测方法、系统、电子设备及计算机程序产品,属于图像处理技术领域,以解决现有监测方法无法在目标空间的不同功能区域对监测对象及其行为影响进行精细化评估等问题。所述方法包括如下步骤:从所述目标空间采集视频数据,确定所述目...
  • 本申请提供了一种零样本多目标追踪方法及装置、电子设备、存储介质,属于目标追踪技术领域,该方法包括:获取连续的视频帧序列数据和语义查询数据;提取连续的视频帧序列数据的时空特征序列,以及将每个图文查询数据进行语义空间映射得到至少一个语义向量,基...
  • 本发明实施例提供一种单目标跟踪方法和装置,涉及目标跟踪技术领域,能够提高单目标跟踪的精确性和鲁棒性。本发明实施例的方法包括:在前帧图像中确定跟踪目标,在跟踪目标的周围背景区域内利用跟踪目标的语义特征提取周围背景区域的语义干扰信息进而创建语义...
  • 本发明公开一种基于YOLOv8的轨道交通工地多类别工程车识别装置、方法、设备及介质,包括:图像获取模块,被配置为获取轨道交通工地的可见光图像和红外图像;多模态特征增强模块,被配置为分别提取可见光图像的纹理结构特征与红外图像的温度分布特征,利...
  • 本发明公开了一种基于时序动态建模的AI生成视频来源归属方法以及系统,提出了一种新颖的TPDNet网络架构。该方法首先采用视觉编码器对输入的视频帧序列进行处理,在空间上将其分解为多个图像块,并提取每个图像块的深度特征;本发明通过独特的维度重排...
  • 本发明涉及异常行为检测技术领域,尤其涉及一种直播异常行为检测方法及系统。本发明的方法包括:获取待检测直播间的视频数据和音频数据;将音频数据输入训练好的人声判定模型中,得到第一分类结果;将视频数据输入训练好的目标检测模型中,得到第二分类结果;...
  • 本发明属于360度视频流传输与深度学习视口预测技术领域,具体提供一种基于空洞卷积与通道注意力机制的视口预测增强方法。针对现有视口预测模型在特征提取时存在的感受野受限、局部细节感知不足及全局上下文建模不充分等问题,本发明将空洞卷积与通道注意力...
  • 本发明涉及计算机视觉和边缘计算技术领域,公开了多算力协同的视频结构化分析方法,其中,多算力协同的视频结构化分析方法包括:获取多路原始视频流,对多路原始视频流进行同步解码;采用梯度分析质量评估解码后的多路原始视频流,基于质量特征向量选择预处理...
  • 本发明属于视频异常检测技术领域,具体涉及一种基于记忆引导的联邦弱监督视频异常检测方法,包括服务器向各客户端发送全局文本和初始的全局模型;所述全局模型包括时间建模模块、记忆模块、提示生成器和冻结的CLIP模型;客户端将当前收到的全局模型作为当...
技术分类