虫极科技(北京)有限公司邬振宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉虫极科技(北京)有限公司申请的专利视频动作检测系统和视频动作检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115546673B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110726106.X,技术领域涉及:G06V20/40;该发明授权视频动作检测系统和视频动作检测方法是由邬振宇;任洲;吴毅;华刚设计研发完成,并于2021-06-29向国家知识产权局提交的专利申请。
本视频动作检测系统和视频动作检测方法在说明书摘要公布了:本发明提供了一种视频动作检测系统,包括:视频主干特征提取模块,配置成将时序视频连续片段输出为对应的5D特征图;人物定位模块,配置成根据所述5D特征图输出对应的人物定位框;动作识别模块,配置成根据所述5D特征图和所述人物定位框,输出每个人物定位框对应的动作类别。本发明的优选实施例提供了一种将3D‑CNN与transformer模型结合的视频动作检测系统,针对视频动作检测的两个子任务,分别采用两个编码器‑解码器结构,以分别执行人物定位和动作识别。本发明所提供的视频动作检测系统,不仅结构简单,易于实现,并且在多个benchmark上取得了最优性能,是视频人物动作检测领域的优选解决方案。
本发明授权视频动作检测系统和视频动作检测方法在权利要求书中公布了:1.一种视频动作检测系统,其特征在于,包括: 视频主干特征提取模块,包括3D-CNN骨干网络,所述3D-CNN骨干网络配置成将时序视频连续片段输出为对应的5D特征图,通过3D卷积降低所述5D特征图的通道数得到4D特征图; 人物定位模块,配置成根据所述5D特征图输出对应的人物定位框,所述人物定位模块包括多个用于人物定位的Transformer模型,配置成根据每个单个视频片段的关键帧生成所述人物定位框,其中所述关键帧是所述4D特征图的中间一帧,以及通过时空间池化层提取所述人物定位框的动作查询选项; 所述人物定位模块包括:第一编码器,配置成对所述单个视频片段对应的4D特征图帧数维度上的中间分片进行空间信息编码;第一解码器,配置成根据人物查询选项和所述空间信息编码输出所述人物定位框的坐标;第一视频切割模块,配置成对所述单个视频片段对应的4D特征图进行切割; 动作识别模块,配置成根据所述5D特征图和所述人物定位框,输出每个人物定位框对应的动作类别,所述动作识别模块包括多个用于动作识别的Transformer模型,配置成根据串联的所述池化后的所述5D特征图输出每个所述人物定位框的动作查询选项对应的动作类别; 所述动作识别模块包括:第二编码器,配置成对所述时序视频连续片段对应的5D特征图进行时空间信息编码,输出场景上下文和人物时序上下文;第二解码器,配置成根据所述动作查询选项、所述场景上下文、所述人物时序上下文输出对应的动作类别;第二视频切割模块,配置成对所述时序视频连续片段对应的5D特征图进行切割。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人虫极科技(北京)有限公司,其通讯地址为:100015 北京市朝阳区酒仙桥路10号院20号楼三层301室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励