华中科技大学陈加忠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华中科技大学申请的专利一种无监督语义分割模型的构建方法、图像语义分割方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119273916B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411301917.5,技术领域涉及:G06V10/26;该发明授权一种无监督语义分割模型的构建方法、图像语义分割方法及设备是由陈加忠;张振洁;朱浩;付子安;刘富瑞;王子今设计研发完成,并于2024-09-18向国家知识产权局提交的专利申请。
本一种无监督语义分割模型的构建方法、图像语义分割方法及设备在说明书摘要公布了:本发明公开了一种无监督语义分割模型的构建方法、图像语义分割方法及设备,属于图像处理技术领域;基于同类样本成群出现的先验原则,利用ViT网络得到的批内图像中两两图像块之间的互注意力权重寻找每个图像块的图像块特征在整张图像中的潜在相似特征;通过将分割头输出的批内图像各图像块的分割头特征,基于处理后的两两图像块之间的互注意力权重进行聚合,得到批内图像各图像块的分割头聚合特征,并进一步输入至投影头中,得到对应的投影聚合特征;通过特征聚合的方式提高了分割头和投影头特征的表达能力,在给予大概率出现的强势语义充分表达的同时,还给予了小概率出现的弱势语义足够的表达,进而精细准确地实现图像语义分割。
本发明授权一种无监督语义分割模型的构建方法、图像语义分割方法及设备在权利要求书中公布了:1.一种无监督语义分割模型的构建方法,其特征在于,包括: 针对预采集的一批图像中的每一个批内图像T: 采用ViT网络将T划分为R行R列个图像块并进行特征提取,得到T的各图像块特征,以及两两图像块之间的互注意力权重;将T的各图像块特征依次经过分割头和投影头进行处理,得到各图像块的投影特征;R为正整数; 将经过所述分割头后所得的T的各图像块的分割头特征构成R×R大小的第一分割头特征矩阵S1;为T的第k个图像块构建对应的R×R大小的权重矩阵Ak,Ak的第l个元素为T的第k个图像块与第l个图像块之间的互注意力权重;将Ak中的各元素归一化后,计算平均值ak,并将Ak中小于ak的元素均置为0;k=1,2,…,R×R;l=i-1×R+j;i=1,2,…,R;j=1,2,…,R;将S1与Ak进行点乘运算后的各元素相加得到T的第k个图像块的分割头聚合特征;将T各图像块的分割头聚合特征输入至所述投影头中,得到T各图像块的投影聚合特征; 构建训练损失函数,并基于所述训练损失函数,同时对所述分割头和所述投影头进行训练;所述训练损失函数包括:以批内图像图像块的投影特征与该图像块的伪正样本的投影特征的相似度最大、且与该图像块的伪负样本的投影特征的相似度最小为目标的第一聚类损失函数,以及以批内图像图像块的投影聚合特征与该图像块的伪正样本的投影聚合特征的相似度最大、且与该图像的伪负样本的投影聚合特征的相似度最小为目标的第二聚类损失函数; 训练结束后,构建包括级联的所述ViT网络、所述分割头、所述投影头和分类模块的无监督语义分割模型; 其中,所述分类模块用于在应用阶段,为待分割图像的每一个图像块,计算其投影特征与其每一个伪正样本的投影特征的相似度,并将该图像块标注为与其相似度最大的伪正样本所携带的类别编号,进而得到所述待分割图像的语义分割结果; 任一图像块b的伪正、负样本通过以下方式确定:将图像块集中与图像块b的相似度大于预设正样本阈值、且除图像块b之外的图像块均作为图像块b的伪正样本;将所述图像块集中与图像块b相似度小于或等于预设正样本阈值的图像块均作为图像块b的伪负样本;所述图像块集包括:每一个批内图像的每一个图像块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励