深圳大学李梦柯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳大学申请的专利针对长尾噪声的模型训练方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119888412B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510345862.6,技术领域涉及:G06V10/774;该发明授权针对长尾噪声的模型训练方法、装置、设备和介质是由李梦柯;凌海权;黄惠设计研发完成,并于2025-03-24向国家知识产权局提交的专利申请。
本针对长尾噪声的模型训练方法、装置、设备和介质在说明书摘要公布了:本发明涉及计算机视觉技术领域,特别涉及针对长尾噪声的模型训练方法、装置、设备和介质,方法包括将输入图像、文本提示词和观测标签输入预训练的视觉语言模型中,视觉语言模型的图像编码器中设置有微调模块;在视觉语言模型中得到文本特征、图像特征及对各个类别的原始输出值,并得到文本预测标签;确定监督启停状态和目标损失函数,并基于目标损失函数对微调模块进行更新,以得到完成训练的视觉语言模型。本申请通过评估文本预测标签和观察标签之间的差异确定是否需要文本图像对齐先验辅助监督,通过校准学习到的特征和观测标签之间的偏差,进而提高了头部类和尾部类样本在高噪声场景下的分类准确率。
本发明授权针对长尾噪声的模型训练方法、装置、设备和介质在权利要求书中公布了:1.一种针对长尾噪声的模型训练方法,其特征在于,所述方法包括: 将目标长尾噪声数据集中的输入图像、所述输入图像对应的文本提示词和观测标签输入预训练的视觉语言模型中,所述视觉语言模型中包括文本编码器和图像编码器,所述图像编码器中设置有微调模块; 在所述视觉语言模型中,所述文本提示词经文本编码器处理后得到文本特征,所述输入图像经图像编码器处理后得到图像特征,所述输入图像经具有微调模块的所述图像编码器处理后得到对各个类别的原始输出值; 计算所述文本特征和所述图像特征之间的文本图像相似度,基于所述文本图像相似度得到文本预测标签; 基于所述文本预测标签和所述观测标签确定监督启停状态,基于所述监督启停状态和所述原始输出值确定目标损失函数,并基于所述目标损失函数对所述微调模块进行更新,以得到完成训练的视觉语言模型; 基于所述文本预测标签和所述观测标签确定监督启停状态,包括: 计算所述文本预测标签和所述观测标签之间的重合率; 获取预设的控制阈值,比对所述重合率与所述控制阈值,得到比对结果; 根据所述比对结果确定监督启停状态; 根据所述比对结果确定监督启停状态,包括: 若所述比对结果为所述重合率大于所述控制阈值,则监督启停状态为监督停用状态; 若所述比对结果为所述重合率小于或等于所述控制阈值,则监督启停状态为监督启用状态。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳大学,其通讯地址为:518060 广东省深圳市南山区南海大道3688号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。