合肥工业大学许水清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利一种基于奇异值分解的YOLOv5猪脸识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116740756B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310531135.X,技术领域涉及:G06V40/10;该发明授权一种基于奇异值分解的YOLOv5猪脸识别方法是由许水清;郑浩东;易文淏;章文焘;陶松兵设计研发完成,并于2023-05-11向国家知识产权局提交的专利申请。
本一种基于奇异值分解的YOLOv5猪脸识别方法在说明书摘要公布了:本发明涉及一种基于奇异值分解的YOLOv5猪脸识别方法,属于计算机视觉领域。该方法通过训练集对搭建的奇异值分解的YOLOv5模型多次迭代训练,再通过验证集最高精度得到对应的最优猪脸识别模型,之后利用其对待识别猪脸图像进行猪脸识别。本发明方法考虑到YOLOv5主干网络是针对全图像进行特征提取,直接应用于猪脸细粒度识别,难以实现有效分类,本发明提出在YOLOv5主干网络后进行奇异值分解,提取特征图中重要特征,忽略次要特征,实现猪脸高精度分类。本发明方法有很好的泛化性能,对于猪侧脸及多角度识别都有一个比较好的效果。
本发明授权一种基于奇异值分解的YOLOv5猪脸识别方法在权利要求书中公布了:1.一种基于奇异值分解的YOLOv5猪脸识别方法,其特征在于,包括将采集到的猪脸图像经过奇异值分解的YOLOv5模型训练得到具有最优识别效果的猪脸识别模型,并利用该最优猪脸识别模型实现猪脸识别,具体包括以下步骤: 步骤1,构建猪脸识别的训练集和验证集 采集N类猪脸图像,其中N记为猪脸图像类别数; 在N类猪脸图像的每个类别中随机挑选K张猪脸图像,得到N×K张猪脸图像,然后对该N×K张猪脸图像采用D种数据增强方法进行图像增强,并保留每种数据增强方法得到的猪脸图像,即共得到N×K×D+1张猪脸图像,将该N×K×D+1张猪脸图像组成训练集; 在N类猪脸图像的每个类别中再另外随机挑选S张图像,得到N×S张猪脸图像,然后对该N×S张猪脸图像采用D种数据增强方法进行图像增强,并保留每种数据增强方法得到的猪脸图像,即共获得N×S×D+1张猪脸图像,将该N×S×D+1张猪脸图像组成验证集,K≠S; 步骤2,搭建基于奇异值分解的YOLOv5模型 所述基于奇异值分解的YOLOv5模型包括主干网络、奇异值分解融合、特征融合网络和检测头,具体步骤如下: 步骤2.1,搭建奇异值分解的YOLOv5模型的主干网络 所述主干网络包括沿主干网络输入-输出方向依次串联的以下结构:一个卷积核大小为6×6、步距为2、填充为2、通道数为64的卷积层α1,一个卷积核大小为3×3、步距为2、填充为0、通道数为128的卷积层α2,一个重复3次C3模块的残差结构χ1,一个卷积核大小为3×3、步距为2、填充为0、通道数为256的卷积层α3,一个重复6次C3模块的残差结构χ2,一个卷积核大小为3×3、步距为2、填充为0、通道数为512的卷积层α4,一个重复9次C3模块的残差结构χ3,一个卷积核大小为3×3、步距为2、填充为0、通道数为1024的卷积层α5,一个重复3次C3模块的残差结构χ4和一个SPPF结构; 所述主干网络的输出为SPPF结构的输出,将该输出记为主干网络的输出χ; 步骤2.2,搭建奇异值分解的YOLOv5模型的奇异值分解融合 对主干网络的输出χ进行奇异值分解,其表达式为χ=U1∑1V1T,其中,U1为左奇异特征向量,∑1为奇异值矩阵,V1T为右奇异特征向量; 将奇异值矩阵∑1按奇异值大小降序排列,左奇异特征向量U1和右奇异特征向量V1T按奇异值矩阵∑1排列顺序排列,得到重新排序的奇异值矩阵∑2、重新排序后的左奇异特征向量U2和重新排序的右奇异特征向量V2T; 选取重新排序的奇异值矩阵∑2的前L个奇异值组成部分奇异值矩阵∑3,选取重新排序的左奇异特征向量U2前L个特征向量组成部分左奇异特征向量U3,选取重新排序的右奇异特征向量V2T前L个特征向量组成部分右奇异特征向量V3T,且η=U3∑3V3T,η为经过奇异值分解的特征图; 将YOLOv5模型的主干网络输出χ与经过奇异值分解的特征图η进行加法融合,其表达式为φ=χ+η,其中,φ为奇异值分解融合的输出; 步骤2.3,搭建奇异值分解的YOLOv5模型的特征融合网络 所述特征融合网络包括沿特征融合网络输入-输出方向依次串联的以下结构:一个卷积核大小为1×1、步距为1、填充为0、通道数为512的卷积层α6,一个上采样层τ1,一个重复3次C3模块的残差结构χ5,一个卷积核大小为1×1、步距为1、填充为0、通道数为256的卷积层α7,一个上采样层τ2,一个重复3次C3模块的残差结构χ6,一个卷积核大小为3×3、步距为2、填充为0、通道数为256的卷积层α8,一个重复3次C3模块的残差结构χ7,一个卷积核大小为3×3、步距为2、填充为0、通道数为512的卷积层α9和一个重复3次C3模块的残差结构χ8; 步骤2.4,搭建奇异值分解的YOLOv5模型的检测头 所述检测头包括以下结构:一个核大小为1×1、步距为1、填充为0、通道数为3×N+5的卷积层α10,一个核大小为1×1、步距为1、填充为0、通道数为3×N+5的卷积层α10,一个核大小为1×1、步距为1、填充为0、通道数为3×N+5的卷积层α12,其中,卷积层α10的输入接残差结构χ6的输出,卷积层α11的输入接残差结构χ7的输出,卷积层α12的输入接残差结构χ8的输出; 步骤3,训练奇异值分解的YOLOv5模型得到最优猪脸识别模型 设共进行了G轮训练,并将其中任意一轮记为第E轮,E=1,2,...,G,第E轮训练的具体步骤如下: 步骤3.1,将训练集猪脸图像按批次送入奇异值分解的YOLOv5模型迭代训练; 步骤3.1.1,随机选取训练集中A张猪脸图像送入奇异值分解的YOLOv5模型,获得奇异值分解的YOLOv5模型预测的边界框信息bbox、类别信息c和目标置信度信息obj,bbox={bbox1,bbox2,...,bboxA},c={c1,c2,...,cA},obj={obj1,obj2,...,objA}; 记A张猪脸图像对应的真实边界框信息为bboxGT={bbox1GT,bbox2GT,...,bboxAGT},真实类别信息为ct={c1t,c2t,...,cAt},真实目标置信度信息为objt={l1,l2,...,lA}; 步骤3.1.2,计算边界框信息损失lbox、类别信息损失lcls和目标置信度信息损失lobj,其计算式分别为: lbox=CIoUbbox,bboxGT lcls=BCEc,ct lobj=BCEobj,objt 其中,CIoU为损失函数,BCE为二值交叉熵损失函数; 步骤3.1.3,通过随机梯度下降算法优化边界框信息损失lbox、类别信息损失lcls和目标置信度信息损失lobj,并通过反向传播更新奇异值分解的YOLOv5模型权重,完成A张猪脸图像的训练; 步骤3.1.4,重复步骤3.1.1到步骤3.1.3,直至训练集中所有猪脸图像都被训练过,则第E轮训练结束; 将通过步骤3.1.1到步骤3.1.4完成训练的奇异值分解的YOLOv5模型称为第E轮的奇异值分解的YOLOv5模型,并记为模型ME; 步骤3.2,将步骤3.1中训练好的模型ME对验证集计算mAP指标; 步骤3.3,G次重复步骤3.1和步骤3.2,得到模型集合M和mAP指标的集合O,M=[M1,M2,...,ME,...MG],O=[mAP1,mAP2,...,mAPE,...mAPG],在mAP指标的集合O中取最大的mAP指标值记为mAPmax,与mAPmax对应位置的模型即为最优猪脸识别模型; 步骤4,利用最优猪脸识别模型对猪脸进行识别 步骤4.1,将待识别猪脸图像送入最优猪脸识别模型,最优猪脸识别模型输出预测边界框信息、预测类别信息和预测目标置信度信息; 步骤4.2,利用非极大值抑制技术对步骤4.1中最优猪脸识别模型输出的预测边界框信息、预测类别信息和预测目标置信度信息进行过滤,去除冗余的边界框信息; 步骤4.3,利用步骤4.2中剩余的预测边界框信息在待识别猪脸图像中标出猪脸位置,并利用预测类别信息和预测目标置信度信息标出猪脸类别和目标置信度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励