安徽建筑大学李莹莹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽建筑大学申请的专利一种基于多尺度注意力机制的视频图像人群计数方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115631454B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211088471.3,技术领域涉及:G06F16/587;该发明授权一种基于多尺度注意力机制的视频图像人群计数方法是由李莹莹;张硕;孙全玲设计研发完成,并于2022-09-07向国家知识产权局提交的专利申请。
本一种基于多尺度注意力机制的视频图像人群计数方法在说明书摘要公布了:本发明涉及一种基于多尺度注意力机制的视频图像人群计数方法,与现有技术相比解决了在复杂场景干扰下难以保证人群计数精确性的缺陷。本发明包括以下步骤:人群图像的获取和预处理;真实人群密度图的生成;构建多尺度注意力机制模块;人群计数模型的构建;人群计数模型的训练;待检测视频图像的获取;视频图像人群的计数。本发明设计了多尺度注意力模块,在不同的尺度分支中嵌入注意力机制来降低模型在不同尺度下无关背景噪声的影响,同时增加模型的尺度多样性。
本发明授权一种基于多尺度注意力机制的视频图像人群计数方法在权利要求书中公布了:1.一种基于多尺度注意力机制的视频图像人群计数方法,其特征在于,包括以下步骤: 11人群图像的获取和预处理:获取人群图像并对其进行预处理,生成训练数据集; 12真实人群密度图的生成:根据预处理后的人群图像,生成真实人群密度图; 13构建多尺度注意力机制模块:构建输入特征图、输出尺度多样性权重通道特征图的多尺度注意力机制模块; 所述构建多尺度注意力机制模块包括以下步骤: 131设定多尺度注意力机制模块的输入为特征图; 132对输入的特征图分别通过卷积核大小不同的卷积,形成四个尺度分支:第一个尺度分支是3×3卷积,第二尺度分支是5×5卷积和第一个分支融合,第三个尺度分支是7×7卷积和第二个尺度分支融合,第四个尺度分支是9×9卷积和第三个尺度分支融合; 133将四个尺度分支通过1×1卷积调整成通道数相等; 134对四个不同尺度分支输出的特征图在通道维度上通过全局平均池化作生成不同尺度分支的不同通道的描述符, 为第X分支的第C个通道的描述符,X和C分别代表尺度分支和通道,X∈{1,2,3,4},C∈{1,2,3,..,m},H、W分别代表特征图的高度、宽度,表示第X尺度分支第C个通道特征图的第i行第j列的元素值; 134对所有的尺度分支和通道下的描述符先做全连接,然后由Relu函数激活,激活值再做全连接,用Sigmoid函数进行激活,得到第X尺度分支第C个通道的注意力描述符 全连接的权重和两个激活Relu、Sigmoid函数的参数在训练中迭代,迭代方式采用Adam梯度下降法; 135对注意力描述符进行归一化,归一化过后的第X尺度分支第C个通道的注意力描述符表示为如公式所示: exp为自然常数e为底的指数函数,是第X尺度分支第C个通道的注意力描述符;是第X尺度分支第C个通道的注意力描述符,m表示通道的个数; 136将归一化后的注意力描述符作为权重点乘上对应尺度和通道的特征图,加权后的各个尺度和通道的特征图融合作为多尺度注意力机制模块的输出; 14人群计数模型的构建:基于多尺度注意力机制模块构建人群计数模型; 所述人群计数模型的构建包括以下步骤: 141设定人群计数模型的输入为训练数据集; 142设定人群计数模型的第一部分为: 训练数据集在人群计数模型中先用预先训练好的VGG16神经网络进行卷积和池化,输出图像的特征图,大小为原始输入图像的18,作为第一部分输出的特征图; 143设定人群计数模型的第二部分为: 第一部分输出的特征图经过一个串行的多尺度注意力模块进行处理,输出第二部分特征图; 144设定人群计数模型的第三部分为: 第二部分特征图再经过一个串行的多尺度注意力模块进行处理,输出第三部分特征图; 145设定人群计数模型的第四部分为: 第三部分特征图再经过一个串行的多尺度注意力模块进行处理,输出第四部分特征图; 146设定人群计数模型的第五部分为用扩张卷积和相应的激活函数回归生成人群密度图: 1461第四部分特征图输入扩张卷积层,该扩张卷积为4层,每层的卷积核的大小分别为3×512、3×256、3×128、3×64,每层的扩张卷积的扩张率为2,输出第五部分特征图; 1462用1×1卷积层将第五部分特征图各通道合并回归输出高分辨率的人群密度图; 15人群计数模型的训练:将人群图像和生成的真实人群密度图对应到人群计数模型的输入和输出,通过神经网络的训练,拟合人群计数模型中的参数,使人群计数模型输出的估计人群密度图和真实人群密度图的相似性达到设定要求; 16待检测视频图像的获取:获取待检测视频图像,并进行预处理; 17视频图像人群的计数:将预处理后的待检测视频图像输入训练后的人群计数模型,得到人群预测密度图;通过对人群预测密度图积分得到人群计数,积分公式如下式所示m、n分别表示生成的人群密度图的长、宽,Ppixelxi,yi表示人群密度图中像素位置为xi,yi处的像素值,像素值的区间大小为[0,1],Ccount表示求得的预测人数; 最终得到视频图像人群计数结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽建筑大学,其通讯地址为:230000 安徽省合肥市蜀山区经济技术开发区紫云路292号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。