Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆邮电大学李国权获国家专利权

重庆邮电大学李国权获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆邮电大学申请的专利一种结合卷积神经网络及Transformer网络的实时目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114842316B

龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210508625.3,技术领域涉及:G06V10/82;该发明授权一种结合卷积神经网络及Transformer网络的实时目标检测方法是由李国权;何斌;夏瑞阳;林金朝;庞宇;朱宏钰设计研发完成,并于2022-05-10向国家知识产权局提交的专利申请。

一种结合卷积神经网络及Transformer网络的实时目标检测方法在说明书摘要公布了:本发明请求保护一种结合卷积神经网络及Transformer网络的实时目标检测方法,属于图像处理领域。包括以下步骤:S1:输入图像数据;S2:图像通过卷积神经主干网络,使提取特征具备归纳偏置特性;S3:设计检测颈部网络,在检测主干网络及头部网络间进行过渡,为检测头部网络提供高分辨率和高语义特征。S4:设计检测头部网络,在头部网络中引入Transformer,为生成的局部特征间构建多个远程依赖关系,并对图像中存在的目标类别及坐标进行表征;S5:设计一种非线性组合方法,用于减少假阴性样本,提升检测模型对目标的捕获能力;S6:在自然数据集上进行检测。基于该方法,在具有挑战性的PASCALVOC2007、2012和MSCOCO2017数据集上实现较好的性能,并且优于许多较为先进的实时检测方法。

本发明授权一种结合卷积神经网络及Transformer网络的实时目标检测方法在权利要求书中公布了:1.一种结合卷积神经网络及Transformer网络的实时目标检测方法,其特征在于,包括以下步骤: S1:向网络输入训练图像数据; S2:设计卷积神经主干网络对用于训练的图像进行特征提取使提取特征具备归纳偏置特性,即经过卷积神经网络提取的特征具备局部性及平移恒等性; S3:设计检测颈部网络,在检测主干网络及头部网络间进行过渡,为检测头部网络提供高分辨率和高语义特征;并且压缩部分层的通道维数; S4:设计检测头部网络,在头部网络中引入Transformer网络即全自注意力网络,为生成的局部特征间构建多个远程依赖关系,并对图像中存在的目标类别及坐标进行表征; S5:设计一种非线性组合方法,由于目标检测模型在S4输出的结果中存在部分假阴性FN样本,因此设计了一种非线性组合方法,用于减少假阴性样本,提升检测模型对目标的捕获能力; S6:在自然数据集上进行检测,并对预测结果利用非极大值抑制算法进行筛选;计算筛选后的预测结果与真实目标框之间交并比IoU大小并统计预测结果,进而获得平均精度值AP、IoU阈值为0.5条件下的平均精度值AP50和IoU阈值为0.75条件下的平均精度值AP75作为模型的评估结果; 所述步骤S1输入需要训练的图像数据集,具体包括以下步骤: 训练的图像数据集采用PASCALVOC和MSCOCO数据集,每次迭代的训练批次大小设置为24,在PASCALVOC上进行50次多尺度训练,多尺度训练的大小为320、352、384、416、448、480、512、544、576和608,图像测试时的大小为448;在MSCOCO上进行300次三尺度训练,三尺度训练的大小为320、352和384,测试时输入图像的长宽大小均为320;使用后处理算法对输出结果进行筛选,从而获得最终的预测结果; 所述步骤S1使用后处理算法对输出结果进行筛选,从而获得最终的预测结果,具体包括: 对预测结果利用非极大值抑制算法进行筛选,对筛选后的结果通过计算样本的预测结果与真实目标框之间的交并比IoU大小,首先,按照预设阈值即两种准则:PASCAL准则和标准的MSCOCO准则确定样本属性;PASCAL准则即IoU0.5及IoU0.7,MSCOCO准则即IoU阈值从0.5到0.95,步长为0.05,对所有样本根据其分类结果由高至低进行排序;对排序后的样本进行遍历,并对已经遍历的样本按照公式1和公式2进行准确率及召回率的计算: 其中,TP、FP和FN表示真正例、假正例和假负例; 根据每次遍历得到的准确率及召回率,构建出以召回率为X轴而准确率为Y轴的曲线;最后通过计算准确率及召回率围成的曲线面积,得到平均精确度AP,并通过计算每个类别的AP得到平均精度均值mAP;使用三个指标即,平均精度值AP、AP50IoU阈值为0.5条件下的平均精度值和AP75IoU阈值为0.75条件下的平均精度值作为模型评估标准,AP50为IoU阈值为0.5条件下的平均精度值,AP75为IoU阈值为0.75条件下的平均精度值,此外,对于小、中、大尺寸的对象,也分别采用APsmall、APmiddle和APlarge进行评估; 所述步骤S3具体包括: 所述检测颈部网络包括特征数据压缩部分和特征融合部分;特征数据压缩部分位于卷积神经主干网络的三阶和四阶网络层,三阶和四阶网络提供丰富的语义信息,特征数据压缩部分通过深度可分离卷积计算方式对主干网络提取的特征进行压缩;之后利用双线性插值对压缩后的特征进行上采样,使三、四阶网络层特征的空间大小与二阶网络层的特征相同;最后,将插值后的特征数据与二阶网络层特征数据在通道维度上进行拼接;二阶网络层提供高分辨率的底层信息,特征融合部分将拼接后的数据再通过深度可分离卷积完成对特征的融合,即将二阶三阶及四阶网络层数据特征进行融合; 所述步骤S4中设计多分支检测头网络,具体包括以下步骤: 在每个分支的输入设置空洞深度卷积,以扩大不同头部分支的感受野RF,然后进行分离操作,在分离操作中,将特征融合网络FFN中的特征在通道维度上划分为两部分,使得被分离的特征的通道维数是原始特征通道数的一半,一部分经过LT,另一部分与LT的输出进行通道维度拼接,然后,融合操作负责将连接特征与1×1大小的卷积核进行融合并通过LeakyReLU激活函数后输出;不同检测头部网络分支中的精简Transformer网络LT中具有相应的图块大小,位于大,中和小尺度物体的检测头部分支网络上的空洞扩张因子和图块大小参数将分别设置为4、2和1; 所述步骤S4中,精简Transformer网络LT分为三个不同的部分,第一部分将输入特征划分为非重叠的图块,并将可学习的位置向量与不同图块的向量映射逐元素相加,以确保每个图块向量映射的位置唯一性;此外,轻量级卷积运算将被引入至LT网络,以降低获取图块向量映射过程中的计算复杂度;每个图块向量映射在输出之前还会经过GELU激活函数; 在公式3中表示: x表示由经过精简图块向量映射后的输出数据,GELUx表示通过该激活函数输出数据; 在第二部分中,位置向量与图块向量映射结合之后,将计算每个图块向量映射查询值、键值和变量值,并在多头空间注意力模块MSAN中并行构建多个全局关联信息,在键值和变量值计算分支中都使用了精简空间压缩模块LSR,通过非重叠卷积运算遍历键值及变量值来压缩它们的序列大小,LT和ViT之间的多头自注意力层的全局关联信息计算复杂度至比为: 其中p、N和C分别代表空间缩减的次数、图块总数和通道维度数; 所述在多头空间注意力模块MSAN中并行构建多个全局关联信息;在公式5中表示: 其中q、k和v分别表示查询值、键值和变量值,dhead表示键值通道维度数,在键值和变量值计算分支中都使用了精简空间压缩模块,最后使用多层感知机MLP和短接进行进一步全局特征提取。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。