Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国矿业大学杨勇获国家专利权

中国矿业大学杨勇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国矿业大学申请的专利基于Mamba适配器与共享提示增强的遥感图像文本检索方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120144816B

龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510307454.1,技术领域涉及:G06F16/583;该发明授权基于Mamba适配器与共享提示增强的遥感图像文本检索方法及装置是由杨勇;许晓宇;张克非;杜文亮;周勇;赵佳琦设计研发完成,并于2025-03-14向国家知识产权局提交的专利申请。

基于Mamba适配器与共享提示增强的遥感图像文本检索方法及装置在说明书摘要公布了:本发明公开了一种基于Mamba适配器与共享提示增强的遥感图像文本检索方法及装置,包括基于多模态适配器与共享提示的CLIP增强网络;通过在CLIP主干模型中引入基于Mamba结构的模态专属适配器,增强对遥感图像长距离空间特征及文本语义关联的建模能力,以此增强对遥感图像主体的聚焦能力;同时,提出动态提示融合模块,基于预训练CLIP提取图像与文本的初始提示特征向量,经投影生成模态专属动态提示,结合可学习的共享提示矩阵,构建融合模态内特征与跨模态交互信息的复合提示向量,并注入CLIP的12层Mamba适配器中,引导模型优化跨模态对齐。本发明通过Mamba适配器提升遥感特征提取效率,结合动态提示实现模态内外信息协同,显著提高遥感图像‑文本检索的精度与泛化性。

本发明授权基于Mamba适配器与共享提示增强的遥感图像文本检索方法及装置在权利要求书中公布了:1.一种基于Mamba适配器与共享提示增强的遥感图像文本检索方法,其特征在于:包括如下步骤: Step1:获取原始遥感图像与对应文本描述,对原始遥感图像进行裁剪与标准化处理,得到设定尺寸的遥感图像; Step2:将遥感图像与对应文本描述按照比例划分为训练集和测试集,其中:训练集包括遥感图像Itrain和对应文本描述Ttrain,测试集包括遥感图像Itest和对应文本描述Ttest; Step3:构建基于多模态适配器与共享提示的CLIP增强网络,包括一个提示生成网络和一个特征提取网络;所述提示生成网络包括一个提示向量提取模块和一个提示生成模块,提示向量提取模块包括一个图像提示向量提取器和一个文本提示向量提取器;所述特征提取网络包括一个特征提取模块和一个适配器模块,适配器模块包括一组图像适配器和一组文本适配器,特征提取模块基于CLIP模型模型设计,CLIP模型包括12层TransformerBlock,在每一个TransformerBlock层的图像端嵌入一个图像适配器,在每一个TransformerBlock层的文本端嵌入一个文本适配器;将提示向量提取模块和特征提取模块中的CLIP模型参数替换为预训练完成的CLIP-B32参数;所述图像适配器包含一个降维线性层、一个数据预处理层、两个TreeMamba深层特征提取层、两个残差连接、一个门控机制连接和一个升维线性层;所述文本适配器包含一个降维线性层、两个Hydra深层特征提取层、一个数据预处理层、两个残差连接、一个门控机制连接和一个升维线性层; 将Itrain和Ttrain输入到提示生成网络中,Itrain经图像提示向量提取器生成图像预提示向量featurep_img,Ttrain经文本提示向量提取器生成文本预提示向量featurep_text,将featurep_img和featurep_text作为提示生成模块的输入; 将featurep_img和featurep_text输入提示生成模块,生成图像最终提示向量和文本最终提示向量 将Itrain和Ttrain分别作为和输入特征提取网络,特征提取网络包括12层TransformerBlock;第j层TransformerBlock的图像端输入记为图像端输出记为将和输入图像适配器,生成图像优化特征第j层TransformerBlock的文本端输入记为文本端输出记为将和输入文本适配器,生成文本优化特征 将的cls_token标记输入线性投影层降维后输出图像特征向量Fimg,将的[EOS]标记输入线性投影层降维后输出文本特征向量Ftext; Step4:采用对称跨模态对比损失与隶属损失的加权组合计算Fimg和Ftext的损失值; Step5:冻结提示向量提取模块和特征提取模块的参数,重复Step3~Step4,直至损失值收敛,完成提示生成模块和适配器模块的训练; Step6:将Itest和Ttest输入提示生成网络,输出图像最终提示向量和文本最终提示向量将Itest、Ttest、和输入特征提取网络,输出Fimg和Ftext Step7:基于Fimg和Ftext执行双向跨模态检索,计算检索性能指标并输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国矿业大学,其通讯地址为:221116 江苏省徐州市铜山区大学路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。