之江实验室李亚南获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉之江实验室申请的专利一种小样本类增量视频动作识别方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120561744B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511049383.6,技术领域涉及:G06F18/2415;该发明授权一种小样本类增量视频动作识别方法和装置是由李亚南;何林圃;李秉泽;崔涵;王东辉设计研发完成,并于2025-07-29向国家知识产权局提交的专利申请。
本一种小样本类增量视频动作识别方法和装置在说明书摘要公布了:本发明公开了一种小样本类增量视频动作识别方法和装置,属于计算机视觉领域,所述方法包括:针对每个视频,通过采用视觉软提示和时序软提示,获取融合空时信息的视频特征,同时获取具有先验知识的视频特征,并将两种视频特征融合,获取最终的视频特征;其次,提取类别的文本原型;最后,计算上述视频特征与文本原型之间的相似度,并将该输入视频预测为具有最大相似度的类别。本发明能够有效捕捉输入视频的空时特征,提升视频动作的识别精度,且方法简便、灵活,显著提高了新类别的预测精度,同时可以有效缓解模型在旧类别上的灾难性遗忘现象。
本发明授权一种小样本类增量视频动作识别方法和装置在权利要求书中公布了:1.一种小样本类增量视频动作识别方法,其特征在于,包括以下步骤: 预训练对比语言图像预训练大模型;将视频中的每帧向量化为视频帧特征向量,输入预训练的图片编码器,对所有帧的输出进行平均,得到先验视频特征;构造视觉软提示向量,与视频帧特征向量拼接,输入预训练的图片编码器,得到视频帧特征,构造时序软提示向量,与视频中所有帧的视频帧特征按时间顺序依次拼接,得到视频特征向量,输入随机初始化的时序编码器,得到视频特征;对视频特征和先验视频特征进行线性融合; 通过预训练的文本编码器获得所有类别文本原型,计算线性融合后的视频特征和各个类别文本原型之间相似度的概率分布与视频对应真实标签的交叉熵损失,以及线性融合后的视频特征与先验视频特征的知识蒸馏损失,加权相加作为损失函数,冻结图片编码器和文本编码器的参数,对视觉软提示向量、时序软提示向量和时序编码器进行训练;所述线性融合后的视频特征与先验视频特征的知识蒸馏损失,通过以下步骤得到:将线性融合后的视频特征投影至先验视频特征空间,并进行残差连接,得到残差连接后的视频特征,计算先验视频特征与残差连接后的视频特征的欧式距离,作为知识蒸馏损失; 在识别待测视频时,计算线性融合后的视频特征和各个类别文本原型之间相似度的概率分布,选取最大概率值对应的类别标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室,其通讯地址为:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励