Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国矿业大学姚睿获国家专利权

中国矿业大学姚睿获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国矿业大学申请的专利一种基于动态提示记忆网络的视频阴影检测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119850651B

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411929997.9,技术领域涉及:G06T7/11;该发明授权一种基于动态提示记忆网络的视频阴影检测方法及装置是由姚睿;李志城;周勇;刘兵;胡伏原;祝汉城;赵佳琦;邵志文设计研发完成,并于2024-12-25向国家知识产权局提交的专利申请。

一种基于动态提示记忆网络的视频阴影检测方法及装置在说明书摘要公布了:本发明公开了一种基于动态提示记忆网络的视频阴影检测方法及装置,借助投影阴影的物体处理混淆阴影,能够在不累积错误的情况下聚合时间信息;该方法包括动态提示模块和基于提示的记忆模块两部分;所述动态提示模块利用局部提示和全局提示,在直接编码阴影困难时将视觉基础模型DINOv2提供的语义信息转换为阴影掩码,局部提示侧重于语义转换,基于语义信息识别阴影位置,全局提示基于颜色和纹理信息识别阴影边界;所述记忆模块用于解决变形和长期时间一致性问题,同时防止错误累积,记忆模块使用局部提示作为时间匹配的代理,减少内存使用并最小化对历史阴影掩码的依赖。本发明方法面向复杂场景下模糊阴影难以检测的问题,能够提升复杂场景下的检测性能,同时保持长期检测时结果的时间一致性。

本发明授权一种基于动态提示记忆网络的视频阴影检测方法及装置在权利要求书中公布了:1.一种基于动态提示记忆网络的视频阴影检测方法,其特征在于:包括动态提示模块和基于提示的记忆模块两部分;所述动态提示模块利用局部提示和全局提示,将视觉基础模型DINOv2提供的语义信息转换为阴影掩码,局部提示侧重于语义转换,基于语义信息识别阴影位置,全局提示基于颜色和纹理信息识别阴影边界;所述记忆模块用于解决变形和长期时间一致性问题,同时防止错误累积,记忆模块使用局部提示作为时间匹配的代理,减少内存使用并最小化对历史阴影掩码的依赖;该方法包括如下步骤: 1给定一个视频片段I,将视频片段I输入到预训练的视觉基础模型DINOv2的每一层编码器中,得到原始特征组D={D1,D2,…Di,…,DN},第i层编码器输出第i层原始特征Di,编码器的总层数为N; 2随机初始化局部提示向量组L={L1,L2,…Li,…,LN}和全局提示向量G,Li为第i层局部提示向量;将原始特征Di分别与局部提示向量Li和全局提示向量G进行交互融合,得到两种增强特征,对得到的两种增强特征进行加权求和,生成第i层编码器的融合增强特征; 3对各层原始特征重复步骤2,得到各层融合增强特征;对各层融合增强特征进行分段融合,得到编码特征 4将编码特征按时间维度分割成T个单帧特征同时,将原始特征Di按时间维度分割成T个单帧将局部提示向量Li按时间维度复制成T份,将第t个单帧作为原始特征Di的当前单帧,将第t份局部提示向量作为对应当前单帧及单帧特征的局部提示子向量;通过记忆读取模块,让单帧特征与记忆库中存储的键-值对进行匹配和交互,使单帧特征获得历史单帧的语义信息,生成记忆增强特征Zt;选取单帧特征对应的最后一层编码器的局部提示子向量使用键值编码器对局部提示子向量和单帧特征进行编码,生成当前单帧的键-值对,将当前单帧的键-值对存入记忆库中,以先进先出的规则选择性淘汰历史单帧的键-值对;为了利用历史单帧减少当前单帧的背景噪声,并且建立不同单帧之间的联系,设计一个基于提示的记忆模块,记忆模块包括键值编码器和记忆读取模块两个部分;记忆模块使用历史单帧的局部提示向量来建立记忆库,并将记忆库用于当前单帧的阴影检测;具体包括如下步骤: 41在键值编码器中,对局部提示子向量和单帧特征进行编码,生成当前单帧的键-值对,然后将当前单帧的键-值对更新到记忆库中; 411对于单帧特征首先使用1×1卷积层将通道数量由C减少到Cm,然后通过卷积门控单元来提取价值区域;所述卷积门控单元包括两路处理,一路处理通过一个全连接层和一个深度可分离卷积来选择单帧特征中的价值区域;另一路处理使用一个全连接层来对齐特征;然后将两路处理的结果进行逐元素相乘,最终将单帧特征Ft编码为值Vt存储到记忆库当中;具体包括如下步骤: 其中:ConvGLU表示卷积门控单元,Conv1×1表示1×1卷积层,Vt表示对单帧特征进行编码后得到的当前单帧的值; 412对于局部提示子向量,选取单帧特征对应的最后一层编码器的局部提示子向量利用一个全连接层对齐局部提示子向量将局部提示子向量编码为键Kt,在处理当前单帧时,记忆库中保存有前Tmax帧历史单帧的键-值对,具体如下: 其中:Linear表示线性层对齐操作;Kt表示当前单帧的键,Vt表示当前单帧的值,Mt指的是处理下一单帧时的记忆库; 42在读取记忆库时,先利用一个全连接层对齐下一单帧的局部提示子向量将局部提示子向量编码为查询向量,然后将查询向量与记忆库进行匹配,生成增强记忆特征Ht+1,表示为: Ht+1=softmaxQt+1×KT×V 其中:Qt+1表示局部提示子向量通过线性层对齐后得到的查询向量;K和V分别指代Mt中所有的键和所有的值;表示处理单帧时的增强记忆特征; 43先将Ht+1传递到一个全连接层将这Nl个匹配结果融合为一个单一结果,然后再使用一个全连接层将通道数量由Cm恢复为C,对Ht+1与进行逐元素相加,最终获得记忆增强特征Zt; 5通过一个解码器,先逐步提升记忆增强特征Zt的分辨率,然后将记忆增强特征Zt解码成阴影掩码Yt。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国矿业大学,其通讯地址为:221116 江苏省徐州市大学路1号中国矿业大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。