Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国矿业大学赵佳琦获国家专利权

中国矿业大学赵佳琦获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国矿业大学申请的专利一种基于结构先验与多尺度特征融合的细粒度目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116310834B

龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310320214.6,技术领域涉及:G06V20/10;该发明授权一种基于结构先验与多尺度特征融合的细粒度目标检测方法是由赵佳琦;欧庆峰;周勇;阿卜杜穆塔利布·埃尔·萨迪克设计研发完成,并于2023-03-29向国家知识产权局提交的专利申请。

一种基于结构先验与多尺度特征融合的细粒度目标检测方法在说明书摘要公布了:本发明提出一种基于结构先验与多尺度特征融合的细粒度目标检测方法,该方法包括:步骤1,获取细粒度遥感图像数据集;步骤2,搭建改进OrientedR‑CNN的网络模型,由主干网络ResNet50与特征金字塔网络FPN得到图片的多尺度特征,并利用Canny边缘检测算法对输入图片进行边缘检测得到边缘检测结果,将边缘检测结果与多尺度特征进行融合得到融合特征,作为OrientedRPN的输入,根据OrientedRPN输出的定位结果,使用特征提取算法从融合特征中提取特征,将特征提取的结果输入到头部分类网络与头部定位网络中;步骤3,利用遥感数据集对步骤2中搭建的目标检测模型进行训练;步骤4,使用训练好的遥感图像目标检测模型对遥感图像进行检测以获得遥感图像中目标的定位和分类。

本发明授权一种基于结构先验与多尺度特征融合的细粒度目标检测方法在权利要求书中公布了:1.一种基于结构先验与多尺度特征融合的细粒度目标检测方法,其特征在于,该方法包括如下步骤: 步骤1,获取细粒度遥感图像数据集Fair1m,并对数据集中的数据预处理; 步骤2,搭建改进OrientedR-CNN的网络模型,由主干网络ResNet50与特征金字塔网络FPN得到图片的多尺度特征,并利用Canny边缘检测算法对输入图片进行边缘检测得到边缘检测结果,将边缘检测结果与多尺度特征进行融合以得到融合特征,作为OrientedRPN的输入,根据OrientedRPN输出的定位结果,使用特征提取算法RoIAlignRotated从融合特征中提取特征,并将特征提取的结果输入到头部网络中,其中,使用基于VisionTransformer的多尺度特征融合分类网络替换头部网络中的分类分支,由头部网络得到定位和分类的检测结果; 步骤3,利用步骤1中预处理处理后的遥感数据集对步骤2中搭建的目标检测模型进行训练; 步骤4,使用训练好的遥感图像目标检测模型对遥感图像进行检测以获得遥感图像中目标的定位和分类; 步骤2中所述特征融合过程如下: 5.1分别将通过边缘检测得到的二值图像特征B下采样4、8、16、32、64倍,得到多尺度二值图像特征b1-b5,特征图大小分别为1*256*256,1*128*128,1*64*64,1*32*32,1*16*16; 5.2将特征金字塔的输出f1-f5与多尺度二值图像特征b1-b5分别进行Concat拼接得到特征F1-F5,特征图大小分别为257*256*256,257*128*128,257*64*64,257*32*32,257*16*16,并将F1-F5替换掉f1-f5作为OrientedRPN模块与特征提取算法RoIAlignRotated的输入; 步骤2中,所述的基于VisionTransformer的多尺度特征融合分类网络的结构如下:基于VisionTransformer的多尺度特征融合分类网络将VisionTransformer模型中的Embedding模块替换为多尺度特征拼接模块,并将TransformerEncoder模块中的TransformerEncoder数量调整为3个; 多尺度特征拼接模块的拼接过程如下: 7.1目标多尺度特征提取: 将融合特征F1-F5输入OrientedRPN中得到定位结果LOC∈RN*5,N为OrientedRPN生成的定位结果的数量,根据每个定位结果loc∈R5,使用特征提取算法RoIAlignRotated从融合特征F1-F3中进行特征提取,特征提取算法RoIAlignRotated将融合特征F1-F3候选区域分别分割成7*7,5*5,3*3个单元格,得到RoI特征R1-R3,特征大小分别为7*7*256,5*5*256,3*3*256,对三维特征R1-R3的前两维进行扁平化以得到目标多尺度特征R1’-R3’,特征大小分别为49*256,25*256,9*256; 7.2positionembedding计算: 根据每个定位结果loc∈x,y,w,h,θ,x,y为中心点坐标,w为旋转框的宽,h为旋转框的长,θ为旋转框与x轴正向夹角,计算RoI特征各单元格对应的定位信息Loci,计算公式如下: 公式2中,g*g为单元格的数量,i为目标多尺度特征第一维的第i项; 通过公式2得到R1’-R3’中各维度的定位信息Loc1∈R49*5、Loc2∈R25*5、Loc3∈R9*5,通过设置两层全连接层fc1,fc2对定位信息进行编码,其中,fc1的输入维度为5,输出维度为256,fc2的输入维度为256,输出维度为256,编码后的位置信息为Loc′1∈R49*256、Loc′2∈R25*256、Loc′3∈R9*256,计算公式如下: Loc′i∈{1,2,3}=fc2fc1Loci3 7.3特征拼接: 将位置信息Loc1’-Loc3’与目标多尺度特征R1’-R3’相加得到V1∈R49*256、V2∈R25*256、V3∈R9*256,计算公式如下: Vi∈{1,2,3}=R′i+Loc′i4 将V1、V2、V3与VisionTransformer中引入的classtoken进行拼接,其中,classtoken∈R1*256,最终得到TransformerEncoder模块的输入VCat∈R84*256。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国矿业大学,其通讯地址为:221116 江苏省徐州市铜山区大学路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。