Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种多维度跨模态视频内容结构化整理系统,包括视频输入接口、语音识别与语义提取模块、视觉镜头分析模块、人脸识别与属性标注模块、多模态信息融合与时间对齐模块和结构化输出模块。本发明的有益效果是:通过多模态信息融合与时间对齐模块实现了...
  • 本发明实施例提供了一种视频生成方法、装置、设备、存储介质和程序产品,获取目标图像;若预设的视频生成模型为文生视频模型,执行以下步骤:确定图像场景对应的场景描述文字;从目标图像中识别目标动态对象和空间信息;根据目标动态对象、空间信息和场景描述...
  • 本发明涉及视频处理技术领域,提供了一种基于多模态大模型的全自动时序视频字幕编排方法和装置。本发明将视频素材和参考文案配合预设提示词输入到多模态大模型,获取格式输出的分时划分结果;根据所述分时划分结果,对所述视频素材进行时间轴上的裁剪,对所述...
  • 本公开提供了视频生成方法、训练深度学习模型的方法、装置及智能体,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于数字人、基于人工智能的内容生成场景。视频生成方法包括:接收源视频帧序列、提示文本和表征目标物品的图...
  • 本公开实施例提供一种媒体生成方法、装置、电子设备及存储介质,通过显示第一用户界面内,第一用户界面内配置有画布面板和智能体面板,其中,所述智能体面板内配置有信息输入框和至少一个参考信息组,参考信息组中包括提示词文本和对应的参考媒体;响应于针对...
  • 本发明涉及视频生成技术领域,具体是一种时空注意力与光流约束的视频生成方法及系统,所述系统包括CLIP文本编码器、多帧潜在噪声初始化模块、时空注意力U‑Net、光流预测模块、动态路径优化器、时空噪声调度模块及视频帧解码器,通过将物理约束嵌入生...
  • 本公开提供了一种视频生成方法、装置、电子设备及存储介质,涉及图像处理技术领域,尤其涉及人工智能和深度学习领域。该视频生成方法包括:获取目标物品的第一图像帧,并确定目标物品的可动部件的局部图像,其中局部图像与第一图像帧相关;通过预训练的图生视...
  • 本发明提供一种基于双中心音频模态融合的说话头视频生成方法、装置、设备、介质及程序产品,涉及人工智能技术领域。该方法包括:获取目标文本、目标音频和目标视频;将所述目标文本、目标音频和所述目标视频输入说话头视频生成模型进行处理,输出说话头视频;...
  • 本申请提供了一种多媒体内容播放方法、跟练方法、推荐方法及电子设备,涉及终端技术领域。该方法可应用于电子设备,电子设备接收到用户输入的多媒体内容需求描述,获取推荐给用户的多媒体内容,并生成与多媒体内容中子内容同步播放的介绍信息,以利用多媒体内...
  • 本发明公开了一种视频流推理方法及视频处理设备,它包括以下步骤:步骤1:根据后端平台需求,将中间格式的音视频流封装为目标协议格式;步骤2:通过“容错重传机制”与“带宽预调节算法”实现稳定传输;步骤3:在音视频流传输的同时记录传输日志,便于后续...
  • 本发明涉及计算机技术领域,公开了一种视频处理方法、设备、存储介质及程序产品。该方法包括:将当前视频图像进行区域划分,获取动态区域和对应的区域优先级;根据区域优先级,获取各动态区域对应的压缩参数,并根据压缩参数对各动态区域进行压缩处理,获取区...
  • 本申请涉及业务网络迁移技术领域,提供一种业务网络迁移方法及系统。所述方法包括:基于目标用户的网络设备组网拓扑,确定待迁移用户清单;目标用户是其机顶盒连接至OTT业务网络的家庭用户;基于待迁移用户清单生成待迁移工单,对待迁移工单进行校验,得到...
  • 本发明公开了一种基于多门控双流视觉特征融合的图像字幕生成方法,特点是通过骨干网络对输入的待生成字幕的图像进行多尺度特征提取;通过区域特征提取器对多尺度特征图进行细粒度物体语义建模;通过网格特征网络对第四张特征图进行空间信息增强操作;通过掩码...
  • 本公开关于一种评论展示方法、装置、电子设备及存储介质,所述方法包括:在目标视频的播放过程中,响应于对所述目标视频的评论查看操作,展示所述目标视频对应的评论展示组件以及评论查看提示信息;所述评论展示组件用于展示所述目标视频对应的至少一个评论;...
  • 本公开的实施例涉及直播交互方法、装置、设备和存储介质。在此提出的方法包括:在与直播间相关联的目标界面中显示与目标应用相关联的互动入口;响应于针对互动入口的选择,在目标应用中创建虚拟互动场景;以及在目标界面的互动面板中显示与虚拟互动场景相关联...
  • 本发明涉及数字网络通信技术领域,具体为一种基于大模型的IPTV系统人脸识别数据翻库方法,通过IPTV终端采集用户的人脸图像数据、观看内容数据及行为日志数据,其中所述人脸图像数据为视频流或定时抓拍的图像帧,所述观看内容数据包括节目元数据、字幕...
  • 本说明书实施例提供交互方法及装置,其中所述交互方法包括:显示讲课视频播放页面,其中,所述讲课视频播放页面包括板书区域和交互区域,所述交互区域中包括至少一个课程交互控件,所述板书区域显示目标课程信息;响应于对所述至少一个课程交互控件中目标课程...
  • 本申请涉及一种播放控制方法、装置、计算机设备和存储介质。所述播放控制方法包括:在显示区域中的第一播放区域,显示正在播放的媒体画面;响应于在所述第一播放区域中选择的位置处触发的暂停播放操作,在所述第一播放区域暂停播放所述媒体画面,并在所述显示...
  • 本发明提供一种智能电视内容推荐方法、系统、设备、介质及程序产品,方法包括:基于目标用户与其他用户之间的人格特质相似度和内容喜爱相似度,确定混合相似度;基于混合相似度,确定目标用户的邻居用户;基于混合相似度和邻居用户对邻居偏好电视内容的内容喜...
  • 本申请提供一种多模态内容安全分析方法、装置、设备、介质及产品,属于人工智能技术领域,方法包括响应于端侧用户下发的数据采集任务,采集多模态内容数据;根据多模态内容识别模型确定多模态内容数据对应的多模态特征;基于场景判别器确定多模态特征对应的目...
技术分类