清华大学深圳国际研究生院王好谦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学深圳国际研究生院申请的专利一种基于热力图和自注意力模块的零样本语义分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116486078B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310365563.X,技术领域涉及:G06V10/26;该发明授权一种基于热力图和自注意力模块的零样本语义分割方法是由王好谦;王颢涵;李洋设计研发完成,并于2023-04-07向国家知识产权局提交的专利申请。
本一种基于热力图和自注意力模块的零样本语义分割方法在说明书摘要公布了:一种基于热力图和自注意力模块的零样本语义分割方法,包括:对训练集中的每一组“类别‑图像‑对应物体掩膜”构成的训练样本,根据预训练的视觉‑语言模型CLIP,生成该类别在该图像上的热力图;将特征融合模块、自注意力模块和掩膜预测头串联,搭建深度神经网络;在每一个训练批次内,采样多组“类别‑图像‑对应物体掩膜”与对应的热力图,将热力图与图像输入网络,得到预测的掩膜,对网络进行训练;给定任一未出现在训练集中的类别与待分割图片,生成该类别在待分割图片中的热力图,将热力图与待分割图片输入训练好的网络中,对待分割图片中的该类别的物体进行分割。本方法可以在完全不需要训练图片的情况下具备分割类别物体的能力。
本发明授权一种基于热力图和自注意力模块的零样本语义分割方法在权利要求书中公布了:1.一种基于热力图和自注意力模块的零样本语义分割方法,其特征在于,包括如下步骤: 第一步,生成热力图:对训练集中的每一组“类别-图像-对应物体掩膜”构成的训练样本,根据预训练的视觉-语言模型CLIP,生成该类别在该图像上的热力图; 第二步,网络搭建:将特征融合模块、自注意力模块和掩膜预测头串联,搭建深度神经网络;搭建的所述网络包含特征融合模块、自注意力模块和掩膜预测头;图像与热力图同时输入所述特征融合模块,得到融合特征图;所述融合特征图输入所述自注意力模块,得到增强特征图;所述增强特征图与所述热力图同时输入掩膜预测头,得到最终的输出掩膜;其中,所述特征融合模块包含特征提取网络、多尺度特征融合模块与特征-热力图融合模块;所述特征提取网络保证在训练与测试中,输入图像大小统一放缩,所述多尺度特征融合模块首先抽取所述特征提取网络的卷积特征图,并将卷积特征图的空间分辨率统一放缩,随后将所述卷积特征图相加,以融合不同分辨率的特征图;所述特征-热力图模块利用特征图的相加结果,对特征图降维,并将热力图与降维后的特征图在通道上连接起来,得到融合特征图;其中,所述掩膜预测头包含上下两个分支,上分支根据增强特征图得到分割掩膜的初始预测结果,下分支用于将初始预测结果与热力图进行加权融合,以使所述热力图能够直达输出端;所述自注意力模块由多个自注意力层堆叠而成,所述自注意力层的定义如下;设输入特征Fi维度为C*H*W,首先将其拉伸为C*HW维度的特征Fi’;随后Fi’输入三个平行的全连接层WQ,WK,WV,得到特征Q,K,V;根据Q与K的相似度对V进行加权求和,得到输出特征A,A经过全连接层与dropout模块后与Q相加,得到输出的增强特征; 第三步,网络训练:在每一轮训练中,在每一个训练批次内,采样多组“类别-图像-对应物体掩膜”与第一步生成的对应的热力图,作为训练数据,将热力图与图像输入所述网络,得到预测的掩膜,计算所述预测的掩膜与真实掩膜间的损失函数,并通过最小化该损失函数对网络进行训练; 第四步,零样本语义分割:给定任一未出现在训练集中的类别与待分割图片,首先以第一步的方式生成该类别在待分割图片中的热力图,然后将热力图与待分割图片输入训练好的网络中,对待分割图片中的该类别的物体进行分割。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学深圳国际研究生院,其通讯地址为:518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励