西北机电工程研究所王鼎衡获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北机电工程研究所申请的专利一种基于多层感知机细粒度张量分解压缩的视频识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117218581B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311240612.3,技术领域涉及:G06V20/40;该发明授权一种基于多层感知机细粒度张量分解压缩的视频识别方法是由王鼎衡;杨维;潘强;卢永超;穆阳;王垚雄;贺宝成设计研发完成,并于2023-09-25向国家知识产权局提交的专利申请。
本一种基于多层感知机细粒度张量分解压缩的视频识别方法在说明书摘要公布了:本发明属于计算机视觉处理技术领域,具体涉及一种基于多层感知机细粒度张量分解压缩的视频识别方法,核心在对训练完成的多层感知机进行处理,得到完成压缩的多层感知机该过程中,首先利用细粒度张量分解形式对多层感知机中的全连接权重进行压缩;然后设计输入向量与细粒度张量分解后的权重之间的免重构算法,使算法输出和原本的向量权重矩阵乘法输出相等;所有待压缩的全连接权重完成压缩后,对所得多层感知机进行微调得到最终结果。所述方法达到在压缩的基础上快速计算的目的,提高多层感知机处理视频识别的可部署性和计算高效性。
本发明授权一种基于多层感知机细粒度张量分解压缩的视频识别方法在权利要求书中公布了:1.一种基于多层感知机细粒度张量分解压缩的视频识别方法,其特征在于,所述方法包括: 步骤A:以总帧数随机地采集摄像头、相机的视频数据,记为,其中,表示每帧视频图像宽度,表示每帧视频图像高度,即视频数据总帧数也就是时间长度,表示每帧视频图像通道数; 步骤B:构建多层感知机对视频数据进行识别; 步骤C:输出视频数据识别后的结果; 其中,所述步骤B包括: 步骤B1:对用于识别视频数据的多层感知机,定义其每帧输入维度为,定义其时间维度为,多层感知机记为,相应的视频数据分割为个输入向量,每个输入向量长度为,输出给步骤B2; 步骤B2:对步骤B1输出的多层感知机进行训练,训练完成的多层感知机记为,输出给步骤B3; 步骤B3:采用多层感知机细粒度张量分解压缩对步骤B2训练完成的多层感知机进行处理,得到完成压缩的多层感知机; 步骤B4:使用步骤B3完成压缩的多层感知机,对视频数据进行识别,生成待输出的视频数据识别后的结果; 其中,所述步骤B3包括: 步骤1:对已经训练好的多层感知机,记其中一层全连接为,记为该层非线性激活函数,读取全连接权重矩阵,维输入向量,以及维输出向量; 步骤2:将和按照约束和因数分解为个整数的乘积,则权重矩阵能够以细粒度张量分解形式进行压缩,即: 其中,是组第路分解的第个因子矩阵,是组第路分解的第个因子矩阵,为组第路分解的秩,为组第路分解的秩,和是单位对角张量,是将张量拉伸为向量的变换,运算符号表示缩并,运算符号表示外积;其中,,;K与I均为整数; 步骤3:定义输入向量与细粒度张量分解后的权重之间的免重构算法,使其输出与的输出相等; 步骤3完成后,若多层感知机中仍有尚未压缩的全连接层,则跳转至步骤1对下一个全连接层进行压缩,如果多层感知机中所有待压缩的全连接层皆已压缩,得到新的多层感知机,进入步骤4; 步骤4:利用误差反向传播算法对新的完成压缩的多层感知机进行有限次数的训练以将其微调至最佳性能。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北机电工程研究所,其通讯地址为:712099 陕西省咸阳市渭城区毕塬东路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励