北京理工大学黄华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种基于未来特征自监督学习的流式感知方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117237840B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311160733.7,技术领域涉及:G06V20/40;该发明授权一种基于未来特征自监督学习的流式感知方法是由黄华;王同博设计研发完成,并于2023-09-08向国家知识产权局提交的专利申请。
本一种基于未来特征自监督学习的流式感知方法在说明书摘要公布了:本发明公开的一种基于未来特征自监督学习的流式感知方法,属于计算机视觉领域。本发明实现方法为:构建未来特征自监督学习的流式感知模型,流式感知模型简称为FFSSL模型。FFSSL模型包括StreamYOLO子模型、YOLOX子模型、自监督模块。利用未来帧的外观特征来增强流式感知的性能,提高FFSSL模型对时间序列数据中连续性和时序变化的捕获能力,确保预测的连续性和准确性;此外,本发明结合StreamYOLO和YOLOX的特点,实现对视频序列中每帧数据的深度解析,得到更丰富、更多样的特征表示,通过对历史、当前和未来帧进行综合分析,保证模型在每一步都能充分地利用每帧的信息,通过自监督的学习策略,有效地整合目标在不同时间点的特征,实现对目标的高精度、高稳定性预测。
本发明授权一种基于未来特征自监督学习的流式感知方法在权利要求书中公布了:1.一种基于未来特征自监督学习的流式感知方法,其特征在于:包括如下步骤, 步骤1:输入检测目标的RGB数据,由历史帧、当前帧和下一帧数据组成,RGB数据为目标预测提供时空连续性的信息,有助于流式感知模型准确捕捉目标在连续帧中的外观特征; 步骤2:构建未来特征自监督学习的流式感知模型,所述流式感知模型简称为FFSSL模型;所述FFSSL模型包括StreamYOLO子模型、YOLOX子模型、自监督模块;所述StreamYOLO子模型用于处理连续帧数据,预测目标的未来状态;所述StreamYOLO由YOLOX子模型、特征融合模块和损失函数组成;所述自监督模块用于利用未标记的RGB数据进行模型训练,利用连续帧中目标的一致性和连续性,强化流式感知模型的学习能力,而不依赖大量标记数据;特征融合模块用于融合连续帧中历史帧和当前帧的特征,增强FFSSL模型对未来状态的预测能力;损失函数用于减小预测和实际未来状态之间的差异;当RGB数据进入模型时,YOLOX子模块从中提取目标特征;目标特征随后输入到StreamYOLO子模型中,特征融合模块将多帧的特征融合在一起;融合后的特征被送入自监督模块,以增强FFSSL模型的预测能力;FFSSL模型通过损失函数进行优化,确保预测的准确性,使FFSSL模型能够综合利用多帧数据; 步骤3:输入步骤1获取的检测目标的RGB数据;将视频帧序列中的当前帧Ft定义为中心帧,并进一步确定其前后相邻帧Ft-1和Ft+1作为历史帧和下一帧;在构建完训练样本数据组后,历史帧Ft-1和当前帧Ft的信息经过特征融合模块进行处理,下一帧Ft+1通过YOLOX进行特征提取;将历史帧Ft-1、当前帧Ft和下一帧Ft+1三个帧作为FFSSL模型的输入; 步骤4:基于StreamYOLO子模型对RGB数据进行处理;利用步骤3中生成的训练样本数据组进行训练,并通过StreamYOLO结构得到特征融合模块的输出; 步骤5:利用StreamYOLO子模型的输出计算分类损失、回归损失和目标度损失,所述损失函数用来进行t+1帧标签监督训练; 步骤6:StreamYOLO的特征融合模块的输出以及通过YOLOX得到的下一帧的特征输出被送入自监督模块;自监督模块利用目标坐标位置标签,对两个输入进行特征提取;两个输入都使用目标坐标位置标签,并根据输入图片与YOLOX子模型及StreamYOLO子模型特征融合模块输出的特征对比,得到一个缩放比例,进而获取新的真值标签;自监督模块对输入图像与YOLOX及StreamYOLO特征融合模块的输出特征进行比对,并计算出一个新的真值标签; 步骤7:利用已提取的特征和真值标签构建样本对,即构建锚点和正负样本对:使用StreamYOLO子模型特征融合模块输出的特征,经过真值标签提取出带有目标区域的锚点;使用YOLOX子模型提取的下一帧的特征,通过缩放后的真值标签提取出带有目标特征的正样本;使用与缩放后的真值标签区域相同大小的背景区域构建负样本;通过构建样本对确保FFSSL模型能够从数据中捕获更鲁棒的特征;使用步骤4中StreamYOLO子模型的融合特征,得到特征图ft-1:t;根据目标的真值标签,计算Ft与融合特征之间的缩放比例,根据该比例计算出特征图中目标的精确位置,获取到目标的锚点区域; 步骤8:通过锚点、正负样本构建特征一致性损失 步骤9:为确保FFSSL模型的预测性能,结合特征一致性损失与监督损失构建综合损失函数 通过结合目标检测技术、特征融合策略和自监督学习模块,提高流感知的准确性; 步骤10:在FFSSL模型的推理阶段不再使用自监督模块,但在训练阶段通过自监督学习形成的特征表示仍然对预测能力产生显著的增强,进而提高对目标的预测精度和稳定性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励