Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 齐鲁工业大学(山东省科学院);山东省人工智能研究院;青岛海尔科技有限公司舒明雷获国家专利权

齐鲁工业大学(山东省科学院);山东省人工智能研究院;青岛海尔科技有限公司舒明雷获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉齐鲁工业大学(山东省科学院);山东省人工智能研究院;青岛海尔科技有限公司申请的专利基于多模态融合的智慧家庭复杂场景物体分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121281000B

龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511841721.X,技术领域涉及:G06V20/52;该发明授权基于多模态融合的智慧家庭复杂场景物体分析方法是由舒明雷;王阿龙;刘照阳;崔振;于靓环;田云龙设计研发完成,并于2025-12-09向国家知识产权局提交的专利申请。

基于多模态融合的智慧家庭复杂场景物体分析方法在说明书摘要公布了:本发明涉及人工智能与数据分析处理技术领域,提出了一种基于多模态融合的智慧家庭复杂场景物体分析方法。具体包括:对输入的数据进行标准化处理,提取局部纹理与全局语义的多尺度特征;由YOLO模型生成候选框与类别分数,依据置信度与目标尺度自适应地生成框提示、点提示及类别文本提示;将提示信息与多尺度特征一同输入掩码解码器,生成候选区域内的高精度实例掩码,并校验得到最终输出。本发明方法避免了重复编码,有效区分了小物体与复杂边界目标的性能,同时兼顾实时性与资源效率,适用于智能家居、室内导航、安防监控及增强现实等场景。

本发明授权基于多模态融合的智慧家庭复杂场景物体分析方法在权利要求书中公布了:1.一种基于多模态融合的智慧家庭复杂场景物体分析方法,其特征在于,包括如下步骤: S1、对输入的智慧家庭复杂场景原始数据进行标准化处理,得到标准化数据;将标准化数据输入共享视觉编码器,提取多层次特征,同时生成捕捉标准化数据长程依赖关系的全局嵌入模型;将多层次特征与全局嵌入模型输入跨注意力融合颈部,通过跨注意力机制融合YOLO风格的局部特征与SAM的全局向量,再经金字塔双向融合与通道重标定,得到多尺度特征集合; S1中跨注意力融合颈部将SAM的全局语义信息注入YOLO风格的多尺度局部特征具体操作如下: a由共享视觉编码器提取标准化图像的多层次特征,具体表示第个尺度的局部特征,总尺度为,,设置;同时,利用同一共享编码器的[CLS]标记或全局池化层,生成捕捉输入数据长程依赖关系的全局语义嵌入向量,输入数据具体指整幅标准化图像; b对于局部特征,将其空间维度展平为序列形式,得到维度的局部token集合,作为注意力机制的查询输入;然后,将局部token集合的投影作为查询向量,并将全局语义嵌入向量的投影作为键向量和值向量; c计算局部token对全局语义的注意力权重,利用注意力权重对全局语义的值向量进行加权聚合,得到更新后的局部特征,并通过残差连接与原始的局部特征相加,输出融合了全局语义的多尺度特征; 其中,表示SAM图像编码器;表示把特征展平成个token;表示局部特征查询投影矩阵,表示全局语义键投影矩阵,表示全局语义值投影矩阵;分别表示查询、键、值向量;d表示每个token的特征维度;表示缩放因子;表示注意力权重;表示转置操作;表示归一化指数函数;全局语义token的数量对应尺度的数量;表示的索引变量; S2、基于YOLO模型对多尺度特征集合进行处理,生成候选框与类别分数,结合所述多尺度特征,通过框提示分支、点提示分支和类别文本提示分支三路并行,自动生成结构化的提示信息; S2中的类别文本提示分支首先生成初始类别提示,然后利用全局语义进行动态修正,具体操作如下: a接收来自YOLO模型输出的第i个候选框对每个类别c的归一化分类分数,通过类别文本提示分的温度系数调节分布平滑度,计算该候选框属于各类别的概率分布;根据概率分布和预定义的类别语义嵌入向量,加权求和得到初始类别提示; b为第i个候选框构建一个门控信号,来判断是否以及如何修正初始提示,同时,全局语义经线性变换后再经过语义对齐投影后作为修正源,进而得到修正后的类别提示; c通过对候选框进行尺度自适应扩张,并映射至特征坐标系得到几何框提示,通过对遮挡或低置信区域进行关键位置提示提取得到点提示; 将修正后的类别提示与几何框提示、点提示进行线性组合,生成最终的统一提示,作为轻量化SAM式掩码解码器的输入; 其中,表示第c类的语义嵌入,表示几何框嵌入函数,表示全局语义token,表示门控权重学习矩阵、表示语义对齐投影矩阵,表示几何框特征投影矩阵、为点提示特征投影矩阵、为文本提示投影矩阵,表示经过线性变换后的全局语义,表示第i个候选框属于类别c的归一化概率,表示第i个候选框的边界框; S3、将提示信息与多尺度特征集合输入轻量化SAM式掩码解码器,生成候选区域内的高精度实例掩码,经非极大值抑制、连通域清理与类别一致性检查校验得到最终输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人齐鲁工业大学(山东省科学院);山东省人工智能研究院;青岛海尔科技有限公司,其通讯地址为:250000 山东省济南市长清区大学路3501号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。