当前位置 : 首页 > 专利喜报 > 武汉大学邵振峰获国家专利权

武汉大学邵振峰获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉武汉大学申请的专利基于视觉文本对齐的影像描述生成方法及系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN116434058B 。

龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310220287.8，技术领域涉及：G06V20/10；该发明授权基于视觉文本对齐的影像描述生成方法及系统是由邵振峰;黄海燕;高济远;张镇宇设计研发完成，并于2023-03-09向国家知识产权局提交的专利申请。

本基于视觉文本对齐的影像描述生成方法及系统在说明书摘要公布了：本发明提供一种基于视觉文本对齐的影像描述生成方法及系统，建立遥感影像描述生成模型，该模型进行遥感影像高级语义特征提取、多尺度特征融合，以及具有门控机制的自适应解码，包括提取遥感影像的多尺度特征信息，对提取的多尺度特征信息进行自适应融合，引导模型关注相关的信息，实现影像的视觉特征与描述语句词汇的对齐；训练遥感影像描述生成模型，将待描述的遥感影像输入到训练好的影像描述生成模型中，得到相应的影像描述语句结果。本发明提供的遥感影像自动化描述生成方案，能够用于海量多源异构的遥感数据，提高影像分类、目标检测等任务的精度。

本发明授权基于视觉文本对齐的影像描述生成方法及系统在权利要求书中公布了：1.一种基于视觉文本对齐的影像描述生成方法，其特征在于：进行以下处理，建立遥感影像描述生成模型，该模型进行遥感影像高级语义特征提取、多尺度特征融合，以及具有门控机制的自适应解码；遥感影像高级语义特征提取，包括提取遥感影像的多尺度特征信息；多尺度特征融合，包括对提取的多尺度特征信息进行自适应融合；所述多尺度特征融合的实现方式为，输入多层感知机MLP进行学习，然后利用Sigmoid激活函数对多个尺度上的特征进行注意力加权，来自适应地对提取到的不同尺度的影像特征信息进行融合，进而提高模型对遥感影像特征的理解能力；门控机制的自适应文本生成解码，包括引导模型关注相关的信息，实现影像的视觉特征与描述语句词汇的对齐；所述门控机制的自适应文本生成解码实现方式为，利用自适应的双层LSTM影像文本对齐模块对影像特征进行解码，其中第一个LSTM为门控注意力LSTM，记为AttentionLSTM；第二个LSTM为自适应语言LSTM，记为languageLSTM；将提取得到的影像多尺度上下文特征送到解码端第一个LSTM中进行解码，生成影像的描述语句；每个时间步t输入到AttentionLSTM的输入向量是当前单词的嵌入向量，图像的平均池化特征，以及第二个LSTM的先前隐藏状态；然后，根据注意力机制引导LSTM多尺度特征的具体位置，通过门控机制优化注意力向量，接下来通过语义门向量实现解码过程视觉特征和描述语句文本信息的自适应对齐，最后，将通过门控注意力生成的上下文向量和AttentionLSTM隐藏状态输入到languageLSTM中，生成描述语句；训练遥感影像描述生成模型，将待描述的遥感影像输入到训练好的影像描述生成模型中，得到相应的影像描述语句结果。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人武汉大学，其通讯地址为：430072 湖北省武汉市武昌区八一路299号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

武汉大学邵振峰获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务