当前位置 : 首页 > 专利喜报 > 杭州电子科技大学陆俊哲获国家专利权

杭州电子科技大学陆俊哲获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉杭州电子科技大学申请的专利一种基于语义指导融合的RGB-D水下显著性目标检测方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN118570623B 。

龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202410673247.3，技术领域涉及：G06V20/05；该发明授权一种基于语义指导融合的RGB-D水下显著性目标检测方法是由陆俊哲;颜成钢;王廷宇;万斌;陈泉;林佳设计研发完成，并于2024-05-28向国家知识产权局提交的专利申请。

本一种基于语义指导融合的RGB-D水下显著性目标检测方法在说明书摘要公布了：本发明公开了基于语义指导融合的RGB‑D水下显著性目标检测方法。首先获取训练和测试该任务的RGB‑D水下显著性目标检测数据集，并对图像数据集进行预处理；然后构建并使用训练数据集训练基于深度学习的轻量化RGB‑D水下显著性目标检测模型；最后使用完成训练的网络模型接收测试数据集进行显著目标检测。本发明网络模型以更低的计算复杂度和更少的参数获取不同模态的特征并进行融合，所提出的语义感知模块对高层的两模态特征的交互进行了指导。经过训练后本发明提出的轻量化网络模型对显著目标检测具有较高的精准度。

本发明授权一种基于语义指导融合的RGB-D水下显著性目标检测方法在权利要求书中公布了：1.一种基于语义指导融合的RGB-D水下显著性目标检测方法，其特征在于，其基本步骤为: 步骤1：获取训练和测试任务的RGB-D水下显著性目标检测数据集，并对图像数据集进行预处理；步骤2：构建并使用训练数据集训练基于深度学习的轻量化RGB-D水下显著性目标检测模型；所述的基于深度学习的轻量化RGB-D水下显著性目标检测模型包括编码器、语义感知模块、多尺度模态融合模块和解码器；步骤3：使用完成训练的网络模型接收测试数据集进行显著目标检测；步骤2具体方法如下：步骤2.1：双流编码器提取特征；采用轻量化骨干MobileNet-v2网络作为编码器来分别提取RGB特征和深度图像特征；将RGB图和深度图输入到编码器中，各自生成5个层级的特征图，表示为和其中i∈{1,2,3,4,5}；步骤2.2：语义感知模块；语义感知模块利用编码器第5层输出的RGB图像特征和深度图像特征通过注意力机制获取语义感知信息，然后将该语义感知信息作为指导对于编码器第3、4和5层输出的模态融合进行优化；语义感知模块首先将RGB特征与深度特征进行通道串联以获取跨模态互补信息：其中：Cat,表示通道拼接，然后利用沿通道维的平均池化和最大池化来获取深度语义权重，同时通过空间注意力机制得到RGB语义权重，通过逐元素乘法将两权重加在跨模态互补信息中以获取语义感知信息SPW；具体如下：其中：Conv3×3表示卷积核尺寸为3×3的卷积操作，UP表示上采样操作，CPavg和CPmax分别表示平均通道池化和最大通道池化，SA表示空间注意力，Sigmoid表示使用Sigmoid激活函数，表示逐元素加法，⊙表示逐元素乘法；步骤2.3：多尺度模态融合模块；所述的多尺度模态融合模块分别对编码器各个层级的输出进行融合，多尺度模态融合模块在编码器第3、4、5层级的输入包括了对应层级的RGB特征、深度特征和语义感知信息SPW，而其余层级的输入没有语义感知信息SPW；输入的RGB特征分别经过2个卷积核为3×3的空洞卷积操作，填充率分别设置为1和3，而深度特征也分别经过2个卷积核为3×3空洞卷积，填充率分别为5和7；将四个分支的输出进行串联以获取多尺度跨模态信息MSE：其中：C1、C3、C5和C7分别表示扩张率为1、3、5和7的空洞卷积操作，Conv3×3表示卷积核尺寸为3×3的卷积操作，Cat,表示通道拼接；为了保留两个模态的特有信息，将MSF与对应层级的两模态特征和进行整合，最终得到两模态融合特征其中：SPW表示语义感知信息，表示逐元素加法，⊙表示逐元素乘法；步骤2.4：解码器；将编码器中不同阶段的两模态特征输入到解码器中，该解码器从第5层的特征开始，将特征上采样后与前一层特征串联进行层级交互并恢复分辨率，得到的结果与下一层特征继续进行层级交互，直到与编码器第一层的两模态特征交互完成，最终得到预测的显著图Pvd，公式表示如下：其中：CBG包括了3×3的卷积操作，批量归一化操作和GELU激活函数；步骤2.5：通过步骤1获取的数据集训练基于深度学习的轻量化RGB-D水下显著性目标检测模型；将步骤1获取的训练集数据输入构建的基于深度学习的轻量化RGB-D水下显著性目标检测模型中，将预测出的显著图Pvd和真值图G进行混合损失函数计算，通过Adam算法进行优化，使用余弦退火策略对学习率进行调整，一共训练200轮；混合损失函数包括二进制交叉熵BCE损失函数，IoU损失函数和SSIM损失函数，计算公式如下：其中，x和y分别代表显著物体和真实值，μx和μy分别是图像x和y的平均值，和分别是图像x和y的方差，σxy是图像x和y的协方差，c1和c2是小常数；最终损失函数被定义为： Lall＝LBCEPvd,G+LIoUPvd,G+LSSIMPvd,G7。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人杭州电子科技大学，其通讯地址为：310018 浙江省杭州市下沙高教园区2号大街；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

杭州电子科技大学陆俊哲获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务