浙江工业大学刘盛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利一种基于级联解码器的语义人物交互检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115909475B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210803060.1,技术领域涉及:G06V40/20;该发明授权一种基于级联解码器的语义人物交互检测方法是由刘盛;郭炳男;陈瑞祥;张峰;陈俊皓设计研发完成,并于2022-07-07向国家知识产权局提交的专利申请。
本一种基于级联解码器的语义人物交互检测方法在说明书摘要公布了:本发明公开了一种基于级联解码器的语义人物交互检测方法,将待检测图像输入到骨干网络提取特征,将提取的特征展平为一维向量,作为后续处理的图像视觉特征,然后将图像视觉特征输入到共享编码器,得到编码特征,之后采用人‑物解码器和动词解码器进行解码,采用语义分支得到置信度分数,采用置信度分数来约束输出,得到最终的检测结果。本发明使用级联解码器的结构来更好的获取人‑物与动作的特征,并通过预训练的语义模块来约束预测结果的输出,最后输出交互结果,提高了人‑物交互检测的精度。
本发明授权一种基于级联解码器的语义人物交互检测方法在权利要求书中公布了:1.一种基于级联解码器的语义人物交互检测方法,基于构建的人-物关系交互检测网络进行检测,其特征在于,所述人-物关系交互检测网络包括骨干网络、共享编码器、人-物解码器、动词解码器和语义分支,所述语义分支包括三元组编码器、sigmoid函数和置信度编码层,所述基于级联解码器的语义人物交互检测方法,包括: 将待检测图像输入到骨干网络提取特征,将提取的特征展平为一维向量,作为后续处理的图像视觉特征; 将图像视觉特征输入到共享编码器,得到人-物编码特征、共享编码特征和视觉编码特征; 将人-物编码特征输入到人-物解码器,得到人-物解码特征,然后将人-物解码特征经过全连接层得到人、物的边界框结果以及物的类别; 将共享编码特征和人-物解码特征输入到动词解码器,得到动词类别特征,并经过全连接层得到动词分类结果; 获取待检测图像有效的三元组数据,输入到三元组编码器,得到三元组编码特征,然后采用视觉编码特征与三元组编码特征构建语义置信度矩阵,对语义置信度矩阵进行sigmoid函数操作后通过置信度编码层,得到对应的置信度分数; 将人、物的边界框结果、物的类别和动词分类结果作为预测三元组,使用置信度分数来约束预测三元组,得到最终的检测结果; 其中,所述获取待检测图像有效的三元组数据,包括: 将待检测图像输入到预训练好的CLIP模型,得到有效的三元组数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励