浙江大学陈蔚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于幅值冷却与可变分组变换器的图像目标检测和语义分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116310720B 。
龙图腾网通过国家知识产权局官网在2025-12-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310202582.0,技术领域涉及:G06V10/82;该发明授权一种基于幅值冷却与可变分组变换器的图像目标检测和语义分割方法是由陈蔚;王闻箫;蔡登设计研发完成,并于2023-03-06向国家知识产权局提交的专利申请。
本一种基于幅值冷却与可变分组变换器的图像目标检测和语义分割方法在说明书摘要公布了:本发明公开了一种基于幅值冷却与可变分组变换器的图像目标检测和语义分割方法,包括:1将输入图片划分为若干小块,分别进行嵌入并添加位置编码;2将得到的输入向量通过若干串行的可变分组的注意力模块和幅值冷却模块,得到图像表征;3将图像表征通过块融合模块,得到降采样的图像表征;4将步骤2~3作为一个阶段,串行地堆叠多阶段,得到层次化的图像表征;5将层次化的图像表征输入到目标检测和语义分割相应的任务头中,训练模型;6将采集的图片处理后输入训练好的模型中,针对目标检测或语义分割分别输出结果。本发明具有更高的目标检测和语义分割处理速度、更稳定的训练过程以及更快的模型收敛速度。
本发明授权一种基于幅值冷却与可变分组变换器的图像目标检测和语义分割方法在权利要求书中公布了:1.一种基于幅值冷却与可变分组变换器的图像目标检测和语义分割方法,其特征在于,包括以下步骤: 1将输入图片划分为若干小块,对每个图片小块分别进行嵌入并添加位置编码,作为之后变换器模型的输入向量; 2将输入向量通过若干串行的可变分组的注意力模块和幅值冷却模块,得到经过模型优化的图像表征; 可变分组的注意力模块用于将整张图像的输入特征图I∈RH×W×D分成若干组其中,H,W表示特征图的高和宽,D表示特征维度,h模块中注意力头的数目,G表示每个分组的大小,随网络结构加深而不断变大;该模块对每个gi分别计算注意力: Qi=LinearQgi,Ki=LinearKgi,Vi=LinearVgi 其中,Linear*表示线性建模层,Q,K,V分别对应自注意力中的查询向量、键向量和值向量; 幅值冷却模块的计算公式如下: O=Layer_NormDepth_ConvI 其中,I,O分别为幅值冷却模块的输入和输出,Depth_Conv*是深度可分离卷积操作,Layer_Norm*是层归一化操作; 3将经过模型优化的图像表征通过块融合模块,得到降采样的图像表征; 4将步骤2~3作为一个阶段,串行地堆叠多阶段,每次将上一阶段的输出作为下一阶段的输入,得到所有输出的降采样图像表征组成的集合,称为层次化的图像表征; 5根据所需的视觉感知任务,将层次化的图像表征输入到目标检测和语义分割相应的任务头中,计算得到损失函数并利用梯度下降方法优化损失函数; 6应用过程中,将采集的图片依照上述步骤1~4得到层次化的图像表征后,输入训练好的模型中,针对目标检测或语义分割分别输出结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励