沪渝人工智能研究院刘太林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉沪渝人工智能研究院申请的专利一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116758523B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310569176.8,技术领域涉及:G06V20/60;该发明授权一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统是由刘太林设计研发完成,并于2023-05-19向国家知识产权局提交的专利申请。
本一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统在说明书摘要公布了:本发明涉及一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统,包括:图片预处理:对图片执行裁剪、旋转和转置等操作,将野山参方向进行归一化;图片增广:对图片执行背景替换、翻转等操作,提升输入特征,增加模型鲁棒性;搭建网络模型并训练:输入野山参图片,提取野山参特征矩阵;网络输出后处理:对模型输出的野山参特征矩阵进行拼接、归一化,选取最大索引作为标签值;模型评估:使用验证集评估模型的性能;推理部署:将模型进行推理部署,提升推理性能。本发明将人工神经网络加入野山参等级鉴定技术中,极大提升等级鉴定的泛化能力,提高了模型的鲁棒性。本发明所提供的方法简单、高效、可复用,可降低人工成本、时间成本。
本发明授权一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统在权利要求书中公布了:1.一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法,其特征在于:该方法包括以下步骤: S1、图片预处理:对图片执行包括裁剪、旋转和转置在内的操作,将野山参方向进行归一化; S2、图片增广:对图片执行包括背景替换、翻转在内的操作,提升输入特征,增加模型鲁棒性; S3、搭建网络模型并训练:输入野山参图片,提取野山参特征矩阵; S4、网络输出后处理:对模型输出的野山参特征矩阵进行拼接、归一化,选取最大索引作为标签值,使用多尺度输出,对等级数量取模,最后得到真正的等级值; S5、模型评估:使用验证集评估模型的性能; S6、推理部署:将模型进行推理部署,提升推理性能; 在步骤S1中,图像输入模型之前,对输入的图片进行预处理,具体包括: S11、从本地读取图片; S12、转为灰度图,采用通道法,并选择G通道作为灰度图; S13、进行二值化操作,对上一步骤中的灰度图,像素值大于等于90点,设置为255,小于90的点设置为0,此刻,将得到一张仅包含0、255两种像素的黑白图片; S14、目标区域识别,选取步骤S13中的图片,提取最大的白色区域,作为野山参的特征区域; S15、提取步骤S14中野山参特征区域的坐标点,选择左上角最小索引、右下角最大索引,得到一个矩形区域的对角坐标点; S16、裁剪山参目标,通过步骤S15的对角线坐标点,在第S11步读取的图片中截取矩形区域,此刻,得到的就是去除多余背景,包含山参的图片; S17、比较第S16步骤中结果图片的高、宽,如果高小于宽,则将图片做一次转置,反之,跳过这一步; S18、通过上一步的比较计算,保存一张高大于宽的图片,此刻,得到一张野山参竖直放置于的图片数据; 在步骤S2中,采用数据增广方式增加可使用的数据量,具体包括以下步骤: S21、读取裁剪后的图片; S22、转为灰度图,采用通道法,并选择G通道作为灰度图; S23、进行二值化操作,对上一步骤中的灰度图,像素值大于等于200的点,设置为1,小于200的点设置为0,此刻,将得到一张仅包含0、1两种像素,高宽与输入图像一致的单通道特征矩阵; S24、遍历第S23步所得的特征矩阵,获取像素值等于1的索引,改变第S21步所读取图片所有通道的像素值,需要改变的位置的索引为本步骤所获取的索引; S25、替换的背景包括是纯色的,包括全部替换为255,0,0、0,255,127或者每个索引点单独随机生成; S26、保存一张新的图片,此刻,虽然野山参没有改变,但是提升了输入图片背景特征的多样性,促进了模型泛化能力; 在步骤S3中,搭建网络模型并训练,具体包括: S31、读取图片并设置输入图片的高为960、宽为640,确保图片缩放后山参变形较小; S32、将上一步所得图片按照以下公式执行归一化、通道前置操作: 在公式中,Pixelchw表示原始像素; S33、对第S32步的结果依次执行公式3卷积、公式2ReLU激活操作; ReLUx=max0,x公式2 在公式2中,max0,x表示取0与x中最大的值; 在公式3中,nh表示输入特征矩阵的高,nw表示输入特征矩阵的宽,kh表示卷积核的高,kw表示卷积核的宽,p表示扩充的宽度,s表示卷积核滑动的步长; S34、对第S33步结果先使用公式4通道注意力机制提取通道特征、对输出使用公式5空间注意力机制提取空间特征: ChannelAttentionx=x×[avg_poolx+max_poolx] 公式4在公式4中,avg_poolx表示对x执行平均池化操作,max_poolx表示对x执行最大池化操作; SpatialAttentionx=x×[meanx,maxx]公式5 在公式5中,meanx表示取x的平均值,maxx取x的最大值; S35、2倍上采样,将低纬特征映射到高纬特征,网络保持高维特征的同时,也能关注到小目标特征;采用双线性插值法实现上采样,融合特征的同时保持计算速度的优势。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人沪渝人工智能研究院,其通讯地址为:400031 重庆市沙坪坝区西园北街31号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励