大连理工大学姜超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学申请的专利一种基于语义和细节协作的弱监督指向性分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119992096B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510154787.5,技术领域涉及:G06V10/26;该发明授权一种基于语义和细节协作的弱监督指向性分割方法是由姜超;张立和;尹宝才设计研发完成,并于2025-02-12向国家知识产权局提交的专利申请。
本一种基于语义和细节协作的弱监督指向性分割方法在说明书摘要公布了:本发明属于人工智能技术领域,公开一种基于语义和细节协作的弱监督指向性分割方法。首先利用两个基于Transformer的编码器分别提取输入图像和文本的特征,然后将两种特征输入到语义感知模块和细节认知模块。两个模块分别关注高级语义和低级细节并用于一个协作学习策略,该策略整合了跨模态内部损失、匹配不变性损失和区域对比损失进而实现充分的视觉语言对齐。语义感知模块和细节认知模块分别生成一个激活图,随后激活图由一个协作模块进行整合,以输出准确的分割掩码。本发明仅使用图像文本对监督模型的训练,不依赖于密集的像素级标签,在显著减少人工标注成本的同时实现了良好的自然语言指示的图像分割性能。
本发明授权一种基于语义和细节协作的弱监督指向性分割方法在权利要求书中公布了:1.一种基于语义和细节协作的弱监督指向性分割方法,其特征在于,步骤如下: 步骤1、构建图像编码器提取图像特征其中一张图像被分割成Nv个不重叠的补丁,Dv表示图像特征的通道维度;构建文本编码器;提取文本特征输入为一个包含Nt个单词的句子,该句子被标记成一个标记序列,一个[CLS]标记被添加到序列的开头;Dt表示文本特征的通道维度; 步骤2、构建语义感知模块; 语义感知模块通过注意力机制捕获图像特征同文本特征的长期依赖关系,将两种特征融合在一起,获得激活图Msem; 步骤3、构建细节认知模块; 细节认知模块通过探索跨模态特征的低级细节来整合图像特征和文本特征,获得激活图Mdet;通过Mdet对图像特征进行加权,得到跨模态特征Fdet; 步骤4、构建协作学习策略 采用协作学习策略来理解图像和文本之间复杂的相关性,通过一个协作模块采用分别突出高级语义和低级细节的激活图来生成分割掩码; 随后,协作学习策略从三个角度利用跨模态信息来确保全面的图像文本对齐:跨模态内部损失、匹配不变性损失和区域对比损失;此外,引入全变分正则化损失来提高分割性能;统一的损失函数同时约束语义感知模块和细节认知模块,确保跨模态特征在两个不同的层次上对齐; 步骤5、通过步骤1-步骤4训练完成后,输入图像和一个自然语言的短句,将图像送入图像编码器提取图像特征,将自然语言的短句送入文本编码器提取文本特征;将图像特征和文本特征送入到语义感知模块和细节认知模块,分别生成关注高级语义的跨模态特征Fsem和关注低级细节的跨模态特征Fdet,同时生成两个激活图;将两种激活图送入协作模块,输出分割结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励