南京邮电大学邵曦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种用于分类的互编码器模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115204367B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210809911.3,技术领域涉及:G06N3/0455;该发明授权一种用于分类的互编码器模型是由邵曦;黄天阳设计研发完成,并于2022-07-11向国家知识产权局提交的专利申请。
本一种用于分类的互编码器模型在说明书摘要公布了:一种用于分类的互编码器模型,对于嘈杂混乱的音视频环境,加入注意力模型以提高对嘈杂音视频的特征提取能力。依赖互编码器模型来实现多模态之前的信息交互以及融合,并且相对与使用多个单独模态的自编码器。本模型优化改进了自编码器,提出了互编码器的概念;通过互编码器和注意力机制的运用提升了分类的准确度;提升了多个模态间的关联性。
本发明授权一种用于分类的互编码器模型在权利要求书中公布了:1.一种互编码器模型,其特征在于: 模型构成包括自注意力单元、深度残差网络单元、分类单元、attention单元、卷积单元、互编码器; 自注意力单元通过卷积单元连接互编码器;深度残差网络单元连接互编码器,同时和互编码器的输出一并通过attention单元连接至分类单元; 自注意力单元将从OpenL3网络获取的音频隐层向量输送至self-attention层进行声学特征抓取,信息抓取后,声学特征能够更多关注特征信息; 深度残差网络单元中,采用预训练模型ResNet50作为视觉特征提取器,输出的数据维度设置为16×10×1024,意味着本模型输入的图像序列重新被表示为10帧且每一帧为1024维的视觉嵌入向量; 分类单元对声学特征和视觉嵌入向量进行分类,分为十类,这10类场景分为室内、室外和交通场所三个类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励