哈尔滨工程大学宿南获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工程大学申请的专利基于混合最小点-瓦瑟斯坦距离的图像目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119672300B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411713736.3,技术领域涉及:G06V10/25;该发明授权基于混合最小点-瓦瑟斯坦距离的图像目标检测方法是由宿南;赵子龙;闫奕名;侯伟;葛宝玉;冯收;赵春晖;顾芳宁;崔洪博设计研发完成,并于2024-11-27向国家知识产权局提交的专利申请。
本基于混合最小点-瓦瑟斯坦距离的图像目标检测方法在说明书摘要公布了:基于混合最小点‑瓦瑟斯坦距离的图像目标检测方法,属于目标检测技术领域,解决了现有计算机视觉的目标检测过程中存在弱小目标易漏检的问题。本发明获取目标图像,采用目标检测模型对图像进行处理,获得标记不同尺度目标的图像;目标检测模型通过预训练得到,具体训练过程为采用全局自注意力机制轻量骨干网络对样本图片进行多尺度特征提取,采用密集嵌套特征融合网络通过上采样或深度可分离卷积进行特征图尺寸转换,通道拼接,获取最终四个尺寸的特征图;对特征融合后的特征图进行不同尺度的位置置信度和类别预测;将所述预测值汇总,获取标记有不同尺度目标的图像,完成一次训练,直至达到预设训练次数,完成训练。本发明适用于图像目标检测。
本发明授权基于混合最小点-瓦瑟斯坦距离的图像目标检测方法在权利要求书中公布了:1.基于混合最小点-瓦瑟斯坦距离的图像目标检测方法,其特征在于,包括: 获取目标图像,采用目标检测模型对目标图像进行处理,获得标记不同尺度目标的图像; 目标检测模型通过预训练得到,目标检测模型的训练方法包括: 采用全局自注意力机制轻量骨干网络对样本图片进行多尺度特征提取,获取多尺度特征图; 采用密集嵌套特征融合网络通过上采样或深度可分离卷积进行特征图尺寸转换,并进行通道拼接,获取最终四个尺寸的特征图; 采用混合最小点-瓦瑟斯坦距离检测器对特征融合后的特征图进行不同尺度的位置预测,采用BCELoss对特征融合后的特征图进行置信度和类别预测,获取不同尺度下图像中感兴趣目标位置、类别及置信度预测值,将不同尺度下图像中感兴趣目标位置、类别及置信度预测值汇总,获取标记有不同尺度目标的图像;完成一次目标检测模型的训练; 对目标检测模型进行设定次数的训练,将最终获得的模型作为目标检测模型; 全局自注意力机制轻量骨干网络采用两层3×3卷积网络对目标图像依次进行两次特征提取,再将提取的特征依次输入至四个全局上下文提取模块,前三个全局上下文提取模块均对接收的特征再次特征提取然后传输给下一个全局上下文提取模块和全局自注意力机制轻量骨干网络模块,第四个全局上下文提取模块对接收的特征再次提取后将提取的特征直接传输至全局自注意力机制轻量骨干网络模块; 密集嵌套特征融合网络接收四个全局上下文提取模块输出的四个尺度的特征图,分别采用深度可分离卷积和上采样对第二个尺度的特征图和第四个尺度的特征图进行尺寸转换,将尺寸转换后的特征图与第三个尺度的特征图进行通道拼接和CSF特征融合;获得第一次融合后特征图; 对第一次融合后特征图分别采用深度可分离卷积和上采样进行尺度转换;转换为第四尺度的特征图和第二尺度的特征图; 对第一尺度的特征图进行深度可分离卷积,转换为第二尺度的特征图; 将原有第二尺度的特征图与转换得的两个第二尺度的特征图进行通道拼接和CSF特征融合,获得第二次融合后的特征图; 对第二次融合后的特征图分别采用深度可分离卷积和上采样进行尺度转换;转换为第三尺度的特征图和第一尺度的特征图; 将原有第一尺度的特征图与转换获得的第一尺度的特征图进行通道拼接,获得最终第一尺度的特征图; 将第二次融合后的特征图与最终第一尺度的特征图卷积获得最终的第二尺度的特征图; 将第一次融合后的特征图与转换获得的第三尺度的特征图进行通道拼接,再将融合后的特征图与最终的第二尺度的特征图卷积,获得最终第三尺度的特征图; 将原有第四尺度的特征图与转换获得的第四尺度的特征图进行通道拼接,再将融合后的特征图与最终的第三尺度的特征图卷积,获得最终第四尺度的特征图; CSF特征融合首先采用一个卷积模块CBL对接收同一尺度的特征图进行特征提取,将提取的特征传输至特征叠加单元和split特征重组单元,所述特征重组单元对接收的特征进行重组后将重组的特征传输至第一个瓶颈单元BottleNeck和特征叠加单元; 第一个瓶颈单元BottleNeck顺次连接有多个瓶颈单元BottleNeck,每个瓶颈单元BottleNeck对接收的信号连续进行两次卷积处理后将处理后的特征传输至下一个瓶颈单元BottleNeck和特征叠加单元;直至最后一个瓶颈单元BottleNeck对接收的信号进行连续两次卷积处理后传输至特征叠加单元; 特征叠加单元对接收的信号进行特征叠加后传输至另一个卷积模块CBL,所述另一个卷积模块CBL对叠加后的特征再次进行特征提取,获取融合后的特征; 采用混合最小点-瓦瑟斯坦距离检测器对特征融合后的特征图进行不同尺度的位置预测方法为: 首先采用K-means聚类方法,对特征图中的目标框进行聚类,获取特征图中不同尺寸和比例的锚框,计算每个锚框与样本图片中对应真实标签的混合最小点-瓦瑟斯坦距离定义的交并比MMPWIoU,将所述交并比大于设定阈值的锚框作为最终位置预测值; 所述混合最小点-瓦瑟斯坦距离定义的交并比MMPWIoU为: 其中,λ和μ分别表示最小点距离和瓦瑟斯坦距离的权重,由于损失函数的取值范围在[0,1],因此λ+μ=1,exp表示指数归一化操作,W2表示瓦瑟斯坦距离,C代表瓦瑟斯坦距离中的归一化常数,根据数据集中目标的平均尺度进行适应性调整,IoU表示原始的交并比计算值,真值框Na的宽度为wa,高度为ha,预测框为Nb,两框左上点之间距离为d1,右下点之间距离为d2。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工程大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区南通大街145号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励