西南科技大学张红英获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西南科技大学申请的专利一种基于残差轴向注意力的医学图像分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119229127B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411476157.1,技术领域涉及:G06V10/26;该发明授权一种基于残差轴向注意力的医学图像分割方法是由张红英;杨利君;黄孝茹设计研发完成,并于2024-10-22向国家知识产权局提交的专利申请。
本一种基于残差轴向注意力的医学图像分割方法在说明书摘要公布了:本发明给出一种基于残差轴向注意力的医学图像分割方法。首先,为解决医学图像中存在病灶部分边界模糊以及变化复杂的问题,设计基于残差轴向注意的通道‑空间转换器,该模块融合编码器中多个阶段的多尺度特征,可有效增强所捕获的深层特征;然后,针对转换器获得的深层特征和上采样特征之间存在语义差距的问题,设计基于残差轴向注意的语义对齐模块,利用解码器提取的浅层特征来指导转换器获得的深层特征进行语义信息对齐;最后,设计结合边缘预测的损失函数,将区域信息作为图像分割任务的几何约束,以鼓励模型生成清晰的病灶边界。本发明利用基于残差轴向注意力的转换器以及语义对齐模块,并结合边缘预测损失函数,可实现对医学图像的精细分割。
本发明授权一种基于残差轴向注意力的医学图像分割方法在权利要求书中公布了:1.一种基于残差轴向注意力的医学图像分割方法,其特征在于,设计基于残差轴向注意的通道-空间转换器增强图像的深层特征、基于残差轴向注意的语义对齐模块消除特征差异性和基于边缘预测损失函数进行几何约束,包括数据集预处理、浅层特征提取、深层特征提取、语义特征对齐、网络模型训练与测试五个部分: 第一部分包括两个步骤: 步骤1,下载公开医学数据集GlaS和MoNuSeg,其中数据集GlaS的原始图像大小不一,大多数为775×522大小的RGB图像,数据集MoNuSeg的原始图像大小均为1000×1000;然后将数据集GlaS和MoNuSeg的样本分辨率统一设置为224×224; 步骤2,将步骤1处理后的图像进行随机翻转和随机旋转两种操作,以增强训练集样本,然后形成最终所需的训练集样本; 第二部分包括两个步骤: 步骤3,将步骤2中得到的数据集进行训练,通过全监督训练方式,该步骤目的在于提取医学图像的浅层语义特征,具体实施如下: 1神经网络以UNet作为主体框架,其中包含4个卷积层,且每个卷积层插入一个最大池化层以及ReLU激活函数,每层卷积层的卷积核维度大小均为3×3,初步得到输入图像I的浅层语义特征E1、E2、E3、E4; 2将不同尺度的特征E1、E2、E3、E4重塑为大小分别为P、P2、P4、P8的标记序列T1、T2、T3、T4,其中通道尺寸全部更改为128; 步骤4,将步骤3得到的浅层语义特征E4作为膨胀卷积模块DCM的输入,得到包含更多信息的输出特征E5,其中DCM包含了5个3×3卷积核,扩展参数为1、2、4、8和16,感受野大小分别为N=3×3、7×7、15×15、31×31和63×63; 第三部分包括三个步骤: 步骤5,将步骤3得到的浅层语义特征的标记序列T1、T2、T3、T4作为输入,采用基于残差轴向注意力的通道注意力模块RA-CAM,学习不同通道之间的相关性,得到图像通道增强的深层特征Tc1、Tc2、Tc3、Tc4,具体实施如下: 1首先将步骤3得到的浅层语义特征的标记序列T1、T2、T3、T4通过通道轴进行连接,得到TΣ;然后为了使网络自适应调整特征通道间的权重,将TΣ作为基于残差轴向注意力模块的查询、值和键,其中,基于残差轴向注意力模块是指针对Transformer缺乏对位置信息的显式感知问题,在轴向注意力中引入残差思想组成残差轴向注意力RA-Attention;最后采用基于残差轴向注意力的通道注意力模块学习通道之间的关系并捕获全局依赖TC,并将TC分割为Tc1、Tc2、Tc3、Tc4; 2在RA-Attention操作中,首先将位置信息rV、rQ、rK加入轴向注意力权重WV、WQ、WK,保留病灶的空间结构和位置关系;然后将TΣ作为残差项Res传递给下一个注意层;最后依次分别在特征图的高度轴上和宽度轴上进行RA-Attention; 步骤6,将步骤5得到的通道增强的深层特征的Tc1、Tc2、Tc3、Tc4作为输入,采用基于残差轴向注意力的空间注意力模块RA-SAM,学习不同空间位置的重要性,得到图像空间增强的深层特征Ts1、Ts2、Ts3、Ts4,具体实施如下: 1首先将步骤5得到的通道增强的深层特征Tc1、Tc2、Tc3、Tc4沿着patch-axis拼接,得到TΣc; 2为了使网络在不同空间位置上动态调整权重,将TΣc作为基于残差轴向注意力模块的值和键,T1、T2、T3、T4为查询,采用基于残差轴向注意力的空间注意力模块学习多个尺度标记序列之间的空间相关性,进行交叉注意力运算得到Ts1、Ts2、Ts3、Ts4; 步骤7,对Ts1、Ts2、Ts3、Ts4依次进行LayerNorm层归一化和MLP多层感知器,得到增强的深层特征TM1、TM2、TM3、TM4,然后将Ts1、Ts2、Ts3、Ts4作为残差项,提高网络的表达能力; 第四部分包括一个步骤: 步骤8,将步骤7得到的深层特征TM1、TM2、TM3、TM4作为输入,采用语义对齐模块SRA进行语义特征对齐操作,得到语义信息一致的对齐特征O1、O2、O3、O4,具体实施如下: 1SRA将步骤4得到的E5重塑为标记序列DTi,其中i=1、2、3、4;将DTi与步骤7得到的深层特征TM1、TM2、TM3、TM4作残差轴向注意力运算,利用上采样特征DTi来指导深层特征TM1、TM2、TM3、TM4,消除两者之间存在的语义不一致; 2将经残差轴向注意力后的输出与标记序列Di在通道维度进行拼接,然后依次进行3×3维度大小的卷积核、BatchNorm批量归一化和ReLU非线性激活函数,最后得到语义信息一致的对齐特征O1、O2、O3、O4; 第五部分包括三个步骤: 步骤9,在损失函数中,首先模拟动力学模型,构建损失函数LossACM,LossACM包含了长度项Length和区域项Region两部分,长度项Length对分割边界轮廓进行约束使得轮廓线相对平滑,区域项Region依据边界内外区域的方差以保持形状: 其中v为真实值,u为预测值,C表示轮廓曲线,Ω表示整个图像中包含的所有点的集合,c1为GT图像边界内所有像素的值,c2为GT图像边界外所有像素的值,λ为大于零的权重系数;然后对于医学图像中通常病灶部分远小于背景部分问题,分割网络总的损失函数Loss为: Loss=LossACM+α·LossDice+β·LossBCE 其中,LossDice为Dice损失函数,LossBCE为交叉熵损失,α和β为大于零的权重系数; 步骤10,将步骤2中的训练集样本输入从步骤3到步骤9的网络中,设置网络超参数:学习率为0.001,迭代次数采用提前停止策略从而不固定,batchsize为4,优化器为Adam,并采用五重交叉验证,损失函数为Loss,训练网络得到最终的医学图像分割预训练模型; 步骤11,将公共测试集输入步骤10得到的预训练模型中,分割出医学图像的病灶部分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西南科技大学,其通讯地址为:621010 四川省绵阳市涪城区青龙大道59号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。