西北工业大学夏辰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种基于不确定性建模的注视估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116311442B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310216242.3,技术领域涉及:G06V40/16;该发明授权一种基于不确定性建模的注视估计方法是由夏辰;钟文琦;韩军伟;王远航;余霖智;郭雷设计研发完成,并于2023-03-08向国家知识产权局提交的专利申请。
本一种基于不确定性建模的注视估计方法在说明书摘要公布了:本发明涉及一种基于不确定性建模的注视估计方法,属于人眼注视估计领域。首先利用卷积神经网络CNN和全连接层分别提取输入的图像信息和关键点特征,然后特征融合,并将融合后的特征嵌入到概率空间中的多元高斯分布。本发明还提出嵌入特征平滑模块,其利用三元组损失约束标签分布与嵌入特征的分布,以学习更光滑有序的概率嵌入特征,使得标签分布与嵌入特征分布更为一致,并且提出一种难例挖掘的方法解决三元组数据维度爆炸的问题。通过将融合特征映射到概率空间以建模注视估计中存在的输入不确定性,并通过将标签概率化以建模标签不确定性,通过引入嵌入特征平滑模块平滑概率空间,从而实现更为准确的注视点估计。
本发明授权一种基于不确定性建模的注视估计方法在权利要求书中公布了:1.一种基于不确定性建模的注视估计方法,其特征在于包括: S1:构建注视估计数据集; S2:对图像进行人脸和人眼检测;具体为:对于手机记录的图像帧,首先利用已有的检测方法分别进行左右眼与人脸图像检测,得到人脸图像与左右眼图像{If,Ieyel,Ieyer},将所述的左右眼图像{Ieyel,Ieyer}的尺寸统一变换到h1×w1大小,其中h1表示人眼图像高度,w1表示人眼图像宽度;将所有的人脸图像If的尺寸统一变换到h2×w2大小,其中h2表示人脸图像高度,w2表示人脸图像宽度;并且得到检测的左右眼图像框与人脸图像框在原图像的坐标位置,并且加入手机放置模式信息形成关键点特征L:L={Be,Bf,O},其中Be表示左右眼图像检测框位置,Bf表示人脸图像检测框位置,O表示手机放置朝向信息;对于未检测到人脸的图像进行标记,并不进入后续的流程中; S3:对检测到的人脸与人眼分别提取特征;具体为:利用CNN模型作为特征提取网络分别对检测到的人脸与左右眼分别提取特征,为了同等地提取左右眼特征,将左右眼特征提取网络共享网络参数,并且将左右眼特征通过CNN模型融合;对于关键点特征L,采用堆叠的全连接层对其进行特征提取;综上,得到人脸特征Ff、人眼特征Fe、关键点特征FL;并且将上述特征{Ff,Fe,FL}融合得到特征Fa; S4:利用概率嵌入对输入不确定性进行建模;具体为:将融合得到特征映射Fa为一个隐变量z,隐变量z为概率空间中的一个高斯分布其中高斯分布的均值μz表示最有可能的特征表示,高斯分布的协方差∑z表示输入的不确定性度量; S5:回归注视点;具体为:对隐变量z进行MonteCarlo采样,得到特征序列: 其中,T1为采样的样本数量,特征序列独立同分布; 并且通过堆叠全连接层的回归器Rφ将特征序列分别进行回归: 其中gi表示回归后的预测注视点,得到预测的注视点 S6:利用概率标签对标签不确定性进行建模,具体为:对于原始标签为一个确定性的点不能建模标签不确定性,将标签概率化即将原始确定性的点转化为一个二维高斯分布二维高斯分布pg: 其中表示高斯分布,二维高斯分布的均值μg为原始的确定性标签二维高斯分布的协方差矩阵∑g为标签不确定的大小,用以衡量标签不确定性大小从而反应标签质量; 训练模型具体为:将概率嵌入与概率标签引入损失函数中,得到PNMSE损失函数: 采用三元组损失约束嵌入概率分布与标签分布,即给定任意的三元组i,j,k满足下式: 其中,D·表示概率分布距离,d·表示欧式距离;对于每一批batch大小的数据,遍历选取每个索引作为三元组的anchor元素i,然后在剩下的batch中随机选取第二个元素j,对于第三个元素k则是在剩下的元素中选择距离标签最近的索引,公式如下: 其中,为数据集的索引集合;经过上述步骤,三元组数量等于batch大小,对于所形成所有三元组的集合记为并且通过以下的约束用于平滑隐变量z,并且使得嵌入概率分布与标签分布更具有一致性: 其中,|·|表示集合的势,η为松弛参数;除此之外,为了防止嵌入分布的均值偏离或者协方差矩阵过大,引入先验损失函数: 其中,E表示单位矩阵; 综上,总的损失函数如下: 其中,λt与λp为平衡系数; 以最小化总的损失函数为优化目标,采用Adam算法训练基于不确定性建模的注视估计模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。