Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连理工大学;沈阳顺义科技股份有限公司杜宪获国家专利权

大连理工大学;沈阳顺义科技股份有限公司杜宪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连理工大学;沈阳顺义科技股份有限公司申请的专利基于改进YOLOv8的工业场景手势识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121259929B

龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511802713.4,技术领域涉及:G06V40/20;该发明授权基于改进YOLOv8的工业场景手势识别方法及系统是由杜宪;王若伍;李英顺;郭占男;孙雪;刘鑫设计研发完成,并于2025-12-03向国家知识产权局提交的专利申请。

基于改进YOLOv8的工业场景手势识别方法及系统在说明书摘要公布了:本发明属于属于计算机视觉与人机交互技术领域,公开了一种基于改进YOLOv8的工业场景手势识别方法及系统。工业场景手势识别方法的步骤如下:图像采集与预处理;构建改进的YOLOv8网络模型:以YOLOv8为基础框架,包含输入层、主干网络、颈部网络和检测头;在YOLOv8的基础框架上增加MSDConv模块和LightContext轻量化注意力模块,以及采用WiseIoU损失函数替换YOLOv8的CIoU损失函数,形成改进的YOLOv8网络模型;模型推理与结果输出。本发明的方法通过改进的YOLOv8网络模型在保持高精度的同时实现轻量化,解决了工业场景中“高精度”与“实时性”难以兼顾的矛盾。

本发明授权基于改进YOLOv8的工业场景手势识别方法及系统在权利要求书中公布了:1.一种基于改进YOLOv8的工业场景手势识别方法,其特征在于,步骤如下: 步骤1:图像采集与预处理; 通过工业摄像头采集工业场景下的操作人员手势的RGB图像;对RGB图像进行数据增强处理,包括亮度调整、噪声注入、旋转、平移、随机裁剪、对比度和饱和度变化、模拟遮挡; 步骤2:构建改进的YOLOv8网络模型; 以YOLOv8为基础框架,包含输入层、主干网络、颈部网络和检测头;在YOLOv8的基础框架上增加MSDConv模块和LightContext轻量化注意力模块,以及采用WiseIoU损失函数替换YOLOv8的CIoU损失函数,形成改进的YOLOv8网络模型; 步骤2.1:设计MSDConv模块,将主干网络的第四个标准卷积以及颈部网络的第一个标准卷积替换成MSDConv模块;MSDConv模块包括主干分支通道、增强分支通道和特征混合环节三部分; MSDConv模块采用并行结构,包括主干分支通道和增强分支通道,按固定比例分配主干分支通道和增强分支通道的输出通道; 主干分支通道通过步长为2的1×1卷积对上一层输出的特征图直接下采样,压缩特征图的尺寸并保留核心信息,特征图的空间维度从[H,W]压缩为[H2,W2],通道数压缩为目标通道数c的12,输出特征x_main,形状为[B,c2,H2,W2]; 增强分支通道先通过1×1卷积对上一层输出的特征图压缩输入通道至目标通道数的14,得到特征x1,再经步长为2的3×3卷积将特征x1下采样至与主干分支通道的空间维度一致,得到特征x2,形状为[B,c4,H2,W2],随后通过并行双增强分支3×3深度卷积和5×5深度卷积提取不同尺度的局部特征,分别得到特征x_enhance1和x_enhance2,形状都为[B,c4,H2,W2]; 随后将主干分支通道与增强分支通道得到的特征x_main、x_enhance1、x_enhanc2沿通道维度拼接,输出特征x_contact,形状为[B,c,H2,W2],之后通过1×1卷积统一通道维度; 输出的特征x_contact进入特征混合环节:将特征x_contact的通道数按顺序平分为4组,分别为分组0、1、2、3,重塑特征维度为[B,4,c4,H2,W2],形成批量-分组-组内通道-高度-宽度的结构;将来自主干分支通道的特征x_main分解为分组0和分组1,将来自增强分支通道的特征x_enhance1和x_enhance2分为分组2和分组3,得到重塑特征;随后对重塑特征进行维度交换,把分组维度和组内通道维度交换位置;再将维度交换后的特征恢复为形状[B,c,H2,W2],得到最终的输出XMSD; 步骤2.2:设计LightContext轻量化注意力模块: 在主干网络中的第二个C2f模块后嵌入LightContext轻量化注意力模块,为空间注意力分支和双通道调制路径的组合; 空间注意力分支设计轻量化解码路径提取输入特征x的全局上下文信息:输入特征x经1×1卷积压缩通道至输入特征x维度的1reduction,reduction为压缩比,得到压缩后的特征;压缩后的特征通过ReLU激活增强非线性后,再经1×1卷积映射为形状为[B,1,H,W]的单通道空间注意力图;对单通道空间注意力图进行Softmax归一化压缩为[B,1,H×W,1],得到空间权重;输入特征x压缩为[B,1,C,H×W],与空间权重做矩阵乘法,输出形状为[B,C,1,1]的全局上下文信息; 将全局上下文信息送入双通道调制路径,包括通道乘法路径和通道加法路径; 通道乘法路径将空间注意力分支提取的全局上下文信息解码为与输入特征x同维度的权重向量,通过Sigmoid激活生成通道注意力权重,与输入特征x逐通道相乘,得到x_mul; 通道加法路径将空间注意力分支提取的全局上下文信息解码为与输入特征x同维度的残差特征x_add,与通道乘法路径的结果x_mul逐通道相加,得到最终优化特征Xoutput; 步骤3:模型推理与结果输出; 将数据增强处理后的RGB图像输入训练好的改进的YOLOv8网络模型;输出手势类别、边界框坐标及置信度;通过非极大值抑制筛选最终检测结果;将识别结果传输至人机交互终端,用于控制指令解析或维护引导。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学;沈阳顺义科技股份有限公司,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。