浙江工业大学宣琦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利一种基于头部姿态估计的儿童坐姿提醒方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114283448B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111551860.0,技术领域涉及:G06V40/10;该发明授权一种基于头部姿态估计的儿童坐姿提醒方法和系统是由宣琦;宋栩杰;周洁韵;翔云;邱君瀚设计研发完成,并于2021-12-17向国家知识产权局提交的专利申请。
本一种基于头部姿态估计的儿童坐姿提醒方法和系统在说明书摘要公布了:本发明公开一种基于头部姿态估计的儿童坐姿提醒方法,包括:S1:从摄像设备获取原始图像,进行有效帧检测并保留有效帧;S2:使用目标检测算法从原始图像提取头部图像;S3:将头部图像输入头部姿态估计网络,得到俯仰角、偏航角、滚转角的概率分布序列和最终的估计角度;S4:将概率分布序列输入一维卷积网络验证准确性,根据估计角度对头部姿态进行判断并对错误姿态进行语音提醒。本发明还包括一种基于头部姿态估计的儿童坐姿提醒系统。本发明能够通过摄像设备对儿童书写阅读场景下的头部欧拉角进行细粒度识别并针对错误姿态进行提醒,同时具有较低的误报率。
本发明授权一种基于头部姿态估计的儿童坐姿提醒方法和系统在权利要求书中公布了:1.一种基于头部姿态估计的儿童坐姿提醒方法,其特征在于:包括以下步骤: S1:从摄像设备获取原始图像,并输入有效帧判别网络进行有效帧检测,若有效帧概率小于无效帧概率则该原始图像为无效帧,反之即为有效帧,保留有效帧; S2:使用目标检测算法对原始图像进行头部检测,并根据检测结果提取头部图像; S3:将头部图像输入头部姿态估计网络,得到欧拉角三个维度的概率分布序列和最终的估计角度俯仰角θp,偏航角θy,滚转角θr; S4:将概率分布序列输入一维卷积网络进行准确度评估,若一维卷积网络输出的准确度小于0.5,则返回步骤S1,否则根据S3中的估计角度进行头部姿态的判断,并针对错误姿态进行语音提醒; 所述步骤S1具体包括: S1.1:将原始图像调整成正方形,并对每一个通道进行归一化,得到Image1; S1.2:将Image1输入有效帧判别网络,输出该帧图像为有效帧和无效帧的概率分别为P1x,P2x,若P1xP2x,则该帧图像为无效帧,反之则为有效帧; 步骤S1.2所述有效帧判别网络是由多个基本网络块构成的轻量级网络,其基本网络块由1×1的普通卷积和3×3的depth-wise卷积构成,并分别在网络块头部和尾部进行通道分离和通道混合操作; 所述步骤S2具体包括: S2.1:将原始图像大小调整成正方形,并对每一个通道进行归一化,得到Image2,Image2的尺寸比Image1更大; S2.2:将Image2输入Yolov5目标检测网络进行头部识别,输出头部外接矩形框在原始图像上的坐标:xl,yl,xr,yr; 其中xl,yl分别为外接矩形框左上角的x坐标和y坐标;xr,yr分别为外接矩形框右上角的x坐标和y坐标; S2.3:根据头部外接矩形框的坐标从原始图像提取头部图像; 所述步骤S3具体包括: S3.1:将头部图像大小调整成正方形,并对每一个通道进行归一化,得到Image3; S3.2:将Image3输入姿态估计网络,得到俯仰角、偏航角、滚转角的概率分布序列以及估计角度; 所述概率分布序列分别记为其中N∈{66,120,66},所述俯仰角范围为[-99°,99°],偏航角范围为[-180°,180°],滚转角范围为[-99°,99°]; 步骤S3.2所述的姿态估计网络包括两个部分:用于特征提取的主干网络和用于回归分类的全连接层网络; 所述主干网络的核心结构由16个移动翻转瓶颈卷积块构成,该移动翻转瓶颈卷积块首先通过1×1卷积改变通道数,接着进行深度卷积,再连接一个压缩与激发模块,压缩与激发模块能够使模型更加关注重要的通道特征,最后再以1×1卷积恢复通道维度并通过连接失活和跳跃连接操作增加模型的泛化性和学习能力; 所述全连接层网络一共包括三个分支,分别用于计算俯仰角、偏航角、滚转角,每个分支的输出是长度为66或120的序列; 所述每个分支又包含分类分支和回归分支,在分类分支中,每个序列单元输出的是类的概率,通过softmax函数获得该分支的概率分布;在回归分支中,每个序列单元代表3°的旋转角度,回归分支通过概率分布计算得到该维度的期望作为估计角度; 所述期望计算公式为: 其中,θpred代表估计角度,pi是序列第i个单元的概率,N是序列长度; 所述头部姿态估计网络通过训练得到,其参数通过最小化代价函数Ltotal进行更新; 所述代价函数由多项损失函数组成: Ltotal=0.4*Lreg+0.4*Lcls+0.2*Lmd2 其中Lreg表示回归分支的损失,为保证角度的惩罚不超过180°,定义损失函数为: Lcls表示分类分支的损失,使用二进制交叉熵作为损失函数; Lmd表示由一维卷积构成的评估网络的损失,用来规范姿态估计网络输出的概率分布特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。