Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军空军特色医学中心杜鹏获国家专利权

中国人民解放军空军特色医学中心杜鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军空军特色医学中心申请的专利一种基于时空通道激励的视频动作识别方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117496405B

龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311473804.9,技术领域涉及:G06V20/40;该发明授权一种基于时空通道激励的视频动作识别方法及设备是由杜鹏;吴伟超;王亚雯;王若永;陈曦蒙;张樱樱;李峰;景洪江;穆慧玲;白霜;张莉莉;郝一铭;刘鹏;桑源设计研发完成,并于2023-11-07向国家知识产权局提交的专利申请。

一种基于时空通道激励的视频动作识别方法及设备在说明书摘要公布了:本发明提供一种基于时空通道激励的视频动作识别方法及设备,该方法包括:构建视频动作数据集,所述数据集中包括视频片段和视频动作类别;构建视频动作识别模型,所述视频动作识别模型包括时空通道激励模块,用于对待识别的视频在空间维度和时序维度上采用通道激励的方法进行特征提取,得到包含空间特征和时序特征的特征图;基于所述视频动作数据集,通过损失函数对所述视频动作识别模型进行迭代训练;将待识别的视频输入训练后的所述视频动作识别模型,得到动作识别结果。本发明解决了现有技术中的视频动作识别方法忽略了空间和时序维度之间的互动,导致识别效果差、效率低的问题。

本发明授权一种基于时空通道激励的视频动作识别方法及设备在权利要求书中公布了:1.一种基于时空通道激励的视频动作识别方法,其特征在于,包括: 构建视频动作数据集,所述数据集中包括视频片段和视频动作类别; 构建视频动作识别模型,所述视频动作识别模型包括时空通道激励模块,用于对待识别的视频在空间维度和时序维度上采用通道激励的方法进行特征提取,得到融合空间特征和时序特征的特征图;所述时空通道激励模块包括输入模块、SGAP模块、TGAP模块和特征融合模块; 所述输入模块用于将对应的所述Resblock模块输出的特征图按通道维度分为两组特征图Xs和Xte,所述Resblock模块输出的特征图为连续多帧图像组成的特征图; 所述SGAP模块和TGAP模块分别用于对两组特征图Xs和Xte分别在空间维度和时序维度上采用通道激励的方法进行特征提取,得到空间特征图和时序特征图,包括:通过所述SGAP模块对其中的一组特征图Xs在空间维度上做平均池化,时序维度保持不变,得到初级空间特征图;对所述初级空间特征图采用一维卷积对空间特征进行建模,得到所述视频对应的空间特征图;通过所述TGAP模块对另一组特征图Xte在时序维度上做平均池化,保持空间维度不变,得到初级时序特征图;对所述初级时序特征图采用二维卷积对时序特征进行建模,得到所述视频对应的时序特征图; 其中,通过下述公式对一组特征图Xs进行平均池化,得到所述初级空间特征图: 其中,为全局平均池化后得到的初级空间特征图,FSGAPXs表示对一组特征图Xs进行空间全局平均池化,H×W是输入特征图的高和宽,xs:,:,h,w表示在时序维度保持不变,在空间维度上对一组特征图Xs进行平均池化; 通过下述公式对初级空间特征图进行建模: 其中,表示对所述初级空间特征图进行建模,Conv1DC2G→C2Gr表示对初级空间特征图从C2G→C2Gr进行降维,Conv1DC2Gr→C2G表示对特征图从C2Gr→C2G进行维度恢复,C为图像通道数,G为分组超参数,r为卷积层降维比率;表示叠加操作; 通过下述公式对另一组特征图Xte进行平均池化,得到所述初级时序特征图: 其中,其中为时间全局平均池化后得到的初级时序特征图,FTGAPXte表示对初级时序特征图进行时间全局平均池化,T是输入特征图的帧数,xte:,t,:,:表示对时序维度进行平均池化,其他维度均保持不变; 通过下述公式对所述初级时序特征图进行建模: 其中,表示对初级时序特征图进行建模,Conv2DC2G→C2Gr表示通过2D卷积对特征从C2G→C2Gr进行降维,Conv2DC2Gr→C2G表示对特征通过2D卷积从C2Gr→C2G进行维度恢复,C为图像通道数,G为分组超参数,r为卷积层降维比率,表示将提取的特征权重与初级时序特征图进行叠加; 所述特征融合模块用于将所述空间特征图和时序特征图进行特征融合,提取得到所述视频的融合空间特征和时序特征的特征图,包括:所述特征融合模块接收所述SGAP模块和TGAP模块输出的所述时序特征图和空间特征图,并将所述时序特征图和空间特征图通过通道错开的方式合并,以及将合并后的特征图进行通道洗牌;通过平均池化操作对通道洗牌后的特征图进行特征提取后与合并后的特征图进行残差连接,并通过激活函数激活后得到所述视频对应的包含空间特征和时序特征的特征图; 所述视频动作识别模型基于Resnet50模型构建得到;所述时空通道激励模块设置于resnet50骨干网络的stage4中,以提升网络的时序提取能力; 基于所述视频动作数据集,通过损失函数对所述视频动作识别模型进行迭代训练得到训练好的视频动作识别模型; 将待识别的视频输入训练后的所述视频动作识别模型,得到动作类别识别结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军空军特色医学中心,其通讯地址为:100142 北京市海淀区阜成路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。