厦门大学纪荣嵘获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利一种基于文本-图像对的无参考图像质量评估方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117115123B 。
龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311131204.4,技术领域涉及:G06T7/00;该发明授权一种基于文本-图像对的无参考图像质量评估方法是由纪荣嵘;高体民;潘文胜;郑侠武;张岩设计研发完成,并于2023-09-04向国家知识产权局提交的专利申请。
本一种基于文本-图像对的无参考图像质量评估方法在说明书摘要公布了:一种基于文本‑图像对的无参考图像质量评估方法,属于计算机视觉技术领域。无参考图像质量评估旨在模拟人类对图像失真的评估,提供一种基于文本‑图像对的无参考图像质量评估方法,充分发挥CLIP模型在挑战性图像感知评估任务中的潜力。首先,提出一种细粒度的质量级别分层策略,使得学习到的特征与图像质量更密切相关。其次,提出一个两阶段训练模型。在模型中,引入一组可学习的文本标记,以充分利用文本编码器的表征能力。同时,提出一个质量感知模块,用于从多个角度评估图像质量并提取与质量级别密切相关的深层特征。
本发明授权一种基于文本-图像对的无参考图像质量评估方法在权利要求书中公布了:1.一种基于文本-图像对的无参考图像质量评估方法,其特征在于包括以下步骤: 1根据数据集中每张图片的分数进行分级并赋予级别或类别标签; 2第一个模型训练阶段,引入一组可学习的文本标记来表示细粒度的图像质量等级,以充分利用文本编码器的表征能力;在这一阶段,训练模型对质量分数文本以及图像的配对能力; 使用的损失函数为: 其中,i表示第i张图片,T和V分别代表文本编码器和图像编码器的输出特征,sim,表示求两个特征的余弦相似度,B表示一个minibatch,A表示与图片i属于同一类别的小批量中的所有图片的集合; 3第二个模型训练阶段,引入一个质量可感知的模块,融合来自多个视角提取的图像特征;模型将根据文本编码器的输出特征以及图像编码器的输入特征计算相似度,并以加权求和的方式得到最终的质量分数;在这一阶段,训练模型准确预测图片质量分数的能力; 1图像编码器为图像i生成特征表示,表示为其中P是补丁的数量;随后,将Zi切片得到 2设L为视图数量,创建注意力面板嵌入此外,将CLS标记扩展L次,得到 3将J+T和Z'作为输入,输入到transformer解码器中,得到多个特征嵌入输出 然后,将S输入到特征融合模块中,得到最终的多视图图像特征Vi;对L个特征进行平均,表示为: 模型将根据文本编码器的输出特征以及图像编码器的输入特征计算相似度,并以加权求和的方式得到最终的质量分数qx; 其中,Pc|x表示应用softmax后的类别概率,C表示类别总数;在这一阶段,训练模型准确预测图片质量分数的能力;这一阶段使用的损失函数为: 其中,α和β是平衡和的系数; 其中,p和p'分别表示真实概率分布以及预测概率分布; 其中,I'k=1-εIk+εC表示质量级别目标分布中的值,Pk表示类别k的预测logits。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361005 福建省厦门市思明区思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。