恭喜西北工业大学张秀伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜西北工业大学申请的专利基于像素级动态模态选择融合的多源目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120107568B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510587275.8,技术领域涉及:G06V10/25;该发明授权基于像素级动态模态选择融合的多源目标检测方法是由张秀伟;曾浩瑞;田雪涛;尹翰林;吴文聪;戴顺;张艳宁设计研发完成,并于2025-05-08向国家知识产权局提交的专利申请。
本基于像素级动态模态选择融合的多源目标检测方法在说明书摘要公布了:本申请涉及人工智能技术领域,公开了一种基于像素级动态模态选择融合的多源目标检测方法,包括:使用双分支卷积神经网络编码器对可见光图像和红外图像进行初步的特征提取,得到可见光初步特征和红外初步特征;使用像素级动态模态权重选择网络,分别对可见光初步特征和红外初步特征进行线性投影、位置编码添加、以及基于CoT注意力机制的模态权重选择,生成模态选择权重,最后再基于模态选择权重进行像素级动态特征选择,得到可见光重选特征和红外重选特征;使用深层网络对可见光重选特征和红外重选特征进行深层的特征提取,再按照分辨率进行逐元素相加,得到融合特征;将融合特征输入至检测头解码器中进行检测,得到目标检测结果。
本发明授权基于像素级动态模态选择融合的多源目标检测方法在权利要求书中公布了:1.一种基于像素级动态模态选择融合的多源目标检测方法,其特征在于,包括: 使用双分支卷积神经网络编码器对成对的可见光图像和红外图像进行压缩和初步的特征提取,得到可见光初步特征和红外初步特征; 使用像素级动态模态权重选择网络,先分别对可见光初步特征和红外初步特征进行线性投影,得到可见光解耦特征和红外解耦特征,再对可见光解耦特征和红外解耦特征进行位置编码添加、以及基于CoT注意力机制的模态权重选择,生成模态选择权重,最后将模态选择权重按照模态分别与可见光解耦特征和红外解耦特征进行逐元素相乘,得到可见光重选特征和红外重选特征; 使用深层网络对可见光重选特征和红外重选特征进行深层的特征提取,依次得到分辨率为原始分辨率的18、116和132的可见光深层特征和红外深层特征,将相同分辨率的可见光深层特征和红外深层特征进行逐元素相加,得到三个融合特征; 将三个融合特征输入至检测头解码器中进行检测,得到目标检测结果; 双分支卷积神经网络编码器的两个分支分别为可见光初步提取分支和红外初步提取分支,两个初步提取分支的结构相同,均由串联的卷积神经网络层、BN批量归一化层和ReLU激活函数层组成; 可见光初步提取分支对可见光图像进行压缩和初步的特征提取,得到分辨率为可见光图像的12的可见光初步特征; 红外初步提取分支对红外图像进行压缩和初步的特征提取,得到分辨率为红外图像的12的红外初步特征; 像素级动态模态权重选择网络由可见光线性投影单元、红外线性投影单元、可见光位置编码单元、红外位置编码单元和模态权重选择单元组成; 深层网络由两个深层分支组成,分别为可见光深层提取分支和红外深层提取分支,两个深层分支的结构相同,均由多个ConvNormLayer和多个ResBlock组成; 双分支卷积神经网络编码器、像素级动态模态权重选择网络、深层网络和检测头解码器共同组成了多源目标检测模型,在对多源目标检测模型进行迭代训练时,使用的总损失函数通过公式表示为: ; 其中,为L1损失,为广义交并比损失,为分类损失,和用于计算预测出的目标的位置与真实的目标的位置之间的差异,用于计算预测出的目标的类别与真实的目标的类别之间的差异,表示总损失函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市碑林区友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。