大连理工大学诸葛云志获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学申请的专利基于上下文标记提示的长视频目标推理分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120707859B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510857459.1,技术领域涉及:G06V10/26;该发明授权基于上下文标记提示的长视频目标推理分割方法是由诸葛云志;刘昊旻;张璐;卢湖川设计研发完成,并于2025-06-25向国家知识产权局提交的专利申请。
本基于上下文标记提示的长视频目标推理分割方法在说明书摘要公布了:本发明属于图像分割技术领域,公开一种基于上下文标记提示的长视频目标推理分割方法,包括预训练图像编码器、多层感知机映射模块、多模态特征融合模块、大语言模型和掩码传播器。先从等分的视频片段中采样支持帧,并与关键帧一起通过预训练的图像编码器和多层感知机映射模块将为相对应的视觉特征;多模态特征融合模块通过多个融合模块,将参考表达与支持帧的视觉特征注入到潜在查询中,生成富集后的潜在查询;这些富集后的潜在查询引导大语言模型生成关键帧及全视频级的标记,最终由基于SAM2的掩码传播器准确解码并在所有帧中持续一致地传播。该方法通过上下文标记提示和多模态特征融合模块解决了长距离依赖建模与一致性跟踪问题。
本发明授权基于上下文标记提示的长视频目标推理分割方法在权利要求书中公布了:1.一种基于上下文标记提示的长视频目标推理分割方法,其特征在于,该长视频目标推理分割方法提出了一种上下文标记提示策略,包括预训练图像编码器、多层感知机映射模块、多模态特征融合模块、大语言模型和掩码传播器;上下文标记提示策略先从等分的视频片段中采样支持帧,支持帧与关键帧一起通过预训练的图像编码器和多层感知机映射模块编码为支持帧与关键帧的视觉特征;随后,多模态特征融合模块通过多个融合模块,将参考表达与支持帧的视觉特征注入到潜在查询中,生成富集后的潜在查询;富集后的潜在查询引导大语言模型生成关键帧及全视频级的SEG标记,最终由基于SAM2的掩码传播器准确解码并在所有帧中持续一致地传播; 带文本先验的多模态融合与潜在查询注入; 多模态特征融合模块引入输入视频中的文本提示作为参考表达,并将参考表达与支持帧特征整合后注入到可学习的潜在查询中;对于每一帧支持帧都随机初始化生成潜在查询,并将所有的潜在查询统称为;接着,将参考表达通过大语言模型的嵌入层编码形成文本嵌入,该文本嵌入被复制并与对应的支持帧的视觉特征拼接,形成一个多模态序列;随后,将多模态序列被融合到中,过程由一个融合模块完成,每个融合模块由一个多头交叉注意力层和一个前馈网络层组成;第层的过程表示为: ; ; 其中,和分别表示随机初始化的多头交叉注意力层和前馈网络层,、和分别表示第层的输入、中间以及输出的潜在查询; 对于上下文标记提示策略的网络结构,多模态特征融合模块的输出表示为: ; 其中,代表富集后的潜在查询,MIC代表多模态特征融合模块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励