中国人民武装警察部队海警学院孟春宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民武装警察部队海警学院申请的专利基于全局和局部注意机制的船舶实例分割算法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115797626B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211330994.4,技术领域涉及:G06V10/26;该发明授权基于全局和局部注意机制的船舶实例分割算法是由孟春宁;孙泽群;张志清设计研发完成,并于2022-10-28向国家知识产权局提交的专利申请。
本基于全局和局部注意机制的船舶实例分割算法在说明书摘要公布了:本发明公开了一种基于全局和局部注意机制的船舶实例分割算法,包括构建船舶实例分割数据集、数据增强、构建使用全局和局部注意力机制GALA的SOLOv2船舶实例分割网络、网络训练与测试等步骤。本发明收集并手动标记了两个新的VL船舶数据集,同时,考虑到海洋船舶实例分割的特殊性,我们提出了GALA注意力机制,该机制利用1D带状池化和2D全局池化来保存输入图像的全局和局部信息,以保留船舶的全局位置和语义信息,从而分割精度较现有注意力机制平均提高了4.3%。本发明建立的新的开源数据集和提出的GALA机制将促进VL船舶应用的研究,并引起其他计算机视觉领域的关注以使用GALA机制。
本发明授权基于全局和局部注意机制的船舶实例分割算法在权利要求书中公布了:1.一种基于全局和局部注意机制的船舶实例分割算法,其特征在于,包括以下步骤: S1、构建船舶实例分割数据集开发用于从Google Image平台收集图像数据的脚本,使用“ship”作为搜索关键字,搜索海洋船舶图像,手动选择真实的海洋船舶图像并使用LabelMe软件对选择的海洋船舶图像进行分割和标记,在标记过程中,首先在图像中不间断地跟踪和标记船舶的形状,从而绘制出不同船只的多边形框,然后对标记的海洋船舶图像进行命名和分类,在使用多边形注释描绘图像中的所有船只后,使用json格式生成图像注释文件,得到数据集,最后采用与MS‑COCO数据集一致的命名和注释方法对数据集进行命名和注释,得到船舶实例分割数据集,命名为MariBoats数据集,MariBoats数据集包含了所有标记过的海洋船舶图像和船舶分割注释,将所有标记过的海洋船舶图像命名为self_boats数据集并将其分配为“ship”类别,同时将coco_boats数据集并入MariBoats数据集中,该coco_boats数据集提取自包含船舶VL图像的已知MS‑COCO数据集; 以MariBoats数据集中六类船舶的图像和分割注释作为数据集,构建得到MariBoatsSubclass数据集,其中,六类船舶为:“Engineering Ship”、“Cargo Ship”、“Speedboat”、“Passenger Ship”、“Official Ship”、“Unknown Ship”; S2、数据增强采用水平翻转、缩放、多尺度输入中的至少一种数据增强方法分别对MariBoats数据集和MariBoatsSubclas数据集进行扩充得到处理后的船舶实例分割数据集,其中水平翻转、缩放、多尺度输入的具体操作分别为: 水平翻转:采用水平翻转的方式对船舶实例分割数据集进行扩充,即以50%的概率对船舶实例分割数据集中的图像执行从左向右翻转180度的水平翻转操作,得到水平翻转后的图像数据并纳入对应的船舶实例分割数据集; 缩放:对船舶实例分割数据集中的图像进行缩放处理,得到压缩的图像数据并纳入对应的船舶实例分割数据集; 多尺度输入:在缩放的基础上,预设多种缩放尺度,并从预设的多种缩放尺度中随机选择一种缩放尺度进行输入,得到多尺度的图像数据并纳入对应的船舶实例分割数据集; S3、构建使用全局和局部注意力机制GALA的SOLOv2船舶实例分割网络构建使用全局和局部注意力机制GALA的SOLOv2船舶实例分割网络,该船舶实例分割网络包含主干网络、脖颈层和预测头部,以该SOLOv2船舶实例分割网络作为SOLOv2船舶实例分割模型,其中: 主干网络指的是用于提取不同阶段特征的卷积神经网络,即ResNet‑50网络; 预测头部用于预测船舶目标的种类和位置; 脖颈层位于主干网络和预测头部之间,脖颈层采用增强后的特征金字塔网络并添加有用于收集不同阶段特征图的网络层; 所述的主干网络包括依次连接的用于提取5个不同阶段特征的5个特征提取段,即stage0、stage 1、stage 2、stage 3和stage 4,所述的脖颈层包含4层网络层,该4层网络层分别由主干网络的stage 1、stage 2、stage 3和stage 4的最后一层特征图构建,构建方法为:对选取自stage 1、stage 2、stage 3和stage 4的最后一层特征图的每个特征图,分别施加一个1×1的卷积层进行通道缩放,构建得到P1、P2、P3、P4层,由于相邻的两个特征提取段之间的特征图有2倍的尺度缩放,因此P1、P2、P3、P4层的宽、高尺度分别为原图的14、18、116和132;首先通过双线性插值方式对P4层的特征图进行2倍上采样,并保持与P3层的特征图相同的宽、高尺度,将P4层的特征图与P3层的特征图做相加操作;然后通过双线性插值方式对P3层的特征图进行2倍上采样,并保持与P2层的特征图相同的宽、高尺度,将P3层的特征图与P2层的特征图做相加操作;之后首先通过双线性插值方式对P2层的特征图进行2倍上采样,并保持与P1层的特征图相同的宽、高尺度,将P2层的特征图与P1层的特征图做相加操作;对于P1、P2、P3和P4层,分别施加一个3×3的卷积层,并连接SOLOv2船舶实例分割模型,该模型包含全局注意力机制模型和局部注意力机制模型,全局注意力机制模型依次由一个整个空间全局平均池化层、一个全连接层、ReLu修正线性单元和sigmoid激活层构成,该全局注意力机制模型将输入的特征图与输出结果执行逐点相乘操作,局部注意力机制模型由X方向的全局平均池化层、Y方向的全局平局池化层、concatenate操作层、1×1卷积层、BN批量规范单元、非线性层、1×1卷积层、split操作层、1×1卷积层和sigmoid激活函数层构成,该局部注意力机制模型将输入的特征图与输出结果执行逐点相乘操作; 所述的全局和局部注意力机制GALA的建立过程为: 1通过全局平均池化降低特征图中整个2D空间信息的维数,即平均每个通道图的所有像素值,获得一个新的1×1通道特征图,第c个通道的特征图的输出表示为: 其中xc是第c个通道的输入图像,H是输入图像的高度,W是输入图像的宽度;zc是第c个通道的输出图像; 经过激活函数和卷积变换处理后,得到通道相关性的特征图,第c个通道的输出图像表示为: 其中表示已经具有通道相关性的第c个通道的输入图像;σ表示sigmoid激活函数;T1和T2是描述每个通道重要性的非线性变换;δ表示ReLu激活函数; 2分别在水平和垂直方向对具有通道相关性的特征图进行一维池化,高度为h的第c个通道的输出图像表示为: 宽度为w的第c个通道的输出图像表示为: 经过激活函数和卷积变换处理后,得到最终的具有通道相关性、方向感知性和位置敏感性的特征图,第c个通道的输出图像表示为: 其中Fh和Fw表示两个1×1的卷积变换; 3最后计算损失函数loss,损失函数定义为: L=Lcate+λLmas,其中Lcate是语义分类的常规Focal Loss,Lmask是mask预测的Dice Loss,为手动设置的参数; S4、网络训练与测试以MariBoatsSubclass数据集中70%的数据作为训练集、30%的数据作为测试集,将步骤S2得到的处理后的船舶实例分割数据集输入步骤S3构建的SOLOv2船舶实例分割模型进行训练,且在训练起始阶段,主干网络采用迁移参数学习,得到训练好的网络;根据训练好的网络验证测试集,输出得到船舶实例分割结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民武装警察部队海警学院,其通讯地址为:315801 浙江省宁波市北仑区小港红联振兴西路205号武警海警学院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励