湖南快乐阳光互动娱乐传媒有限公司张康获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南快乐阳光互动娱乐传媒有限公司申请的专利一种视频理解方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120047777B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510511550.8,技术领域涉及:G06V10/774;该发明授权一种视频理解方法及相关装置是由张康;胡灿;姚广;祁晗;杨杰设计研发完成,并于2025-04-23向国家知识产权局提交的专利申请。
本一种视频理解方法及相关装置在说明书摘要公布了:本申请提供一种视频理解方法及相关装置,涉及计算机视觉领域,应用于第一设备,该设备安装的视频理解大模型中视觉编码器与图像连接器之间部署权重分配函数和时间感知层。该设备接收第二设备输入的包含第一视频和第一提示词的视频理解任务;通过视觉编码器获取第一视频中第一视频帧的第一视觉特征;运行权重分配函数,对第一视觉特征中的关键特征和冗余特征分配不同权重得到第一关键视觉特征;通过时间感知层将第一视频帧的时序信息添加至第一关键视觉特征中得到第一目标视觉特征;向第二设备返回视频理解大模型基于第一视频特征和第一提示词输出的第一视频理解结果。本申请可以解决有效信息丢失和时序信息混乱的问题。
本发明授权一种视频理解方法及相关装置在权利要求书中公布了:1.一种视频理解方法,其特征在于,所述方法应用于第一设备,所述第一设备中安装有视频理解大模型,所述视频理解大模型中的视觉编码器与图像连接器之间部署有权重分配函数和时间感知层,所述方法包括: 接收第二设备输入的视频理解任务,所述视频理解任务包含第一视频和第一提示词; 通过所述视觉编码器获取所述第一视频中第一视频帧的第一视觉特征; 运行所述权重分配函数,对所述第一视觉特征中的关键特征和冗余特征分配不同权重,以获得第一关键视觉特征; 通过所述时间感知层将所述第一视频帧的时序信息添加至所述第一关键视觉特征中,以获得第一目标视觉特征,所述第一目标视觉特征是所述图像连接器提取第一视频特征的依据; 向所述第二设备返回第一视频理解结果,所述第一视频理解结果是所述视频理解大模型基于所述第一视频特征和所述第一提示词输出的; 其中,所述运行所述权重分配函数,对所述第一视觉特征中的关键特征和冗余特征分配不同权重,以获得第一关键视觉特征,包括: 通过二维特征矩阵的转换操作,将所述第一视觉特征划分为多个特征块; 针对所述第一视觉特征中时间点连续的两个视觉特征,计算空间位置相同的两个特征块之间的相似度,并根据所述相似度为时间点较晚的特征块分配目标权重,所述目标权重与所述相似度之和为1; 按照所述第一视觉特征中各特征块对应的目标权重,对所述第一视觉特征进行加权处理得到所述第一关键视觉特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南快乐阳光互动娱乐传媒有限公司,其通讯地址为:410003 湖南省长沙市开福区湖南国际会展中心北四楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。