贵州大学黄海松获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉贵州大学申请的专利基于跨模态注意力机制的多模态数据语义对齐方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120724398B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511228563.0,技术领域涉及:G06F18/25;该发明授权基于跨模态注意力机制的多模态数据语义对齐方法及装置是由黄海松;付盛伟;刘超;李宜汀;马驰;范青松设计研发完成,并于2025-08-29向国家知识产权局提交的专利申请。
本基于跨模态注意力机制的多模态数据语义对齐方法及装置在说明书摘要公布了:本申请涉及多模态语义对齐领域,提供一种基于跨模态注意力机制的多模态数据语义对齐方法及装置。该方法包括:获取多模态数据及其对应的类别标签,并通过预先训练好的多模态编码器将多模态数据映射为多模态嵌入向量;根据多模态大语言模型生成与多模态数据对应的文本描述,并结合类别标签对文本描述进行筛选,构建多模态知识库;基于多模态知识库,构建多元嵌入中心;通过跨模态注意力机制,将多模态嵌入向量与所述文本描述进行交互,生成语义增强后的多模态嵌入向量;将所述语义增强后的多模态嵌入向量与多元嵌入中心进行对比学习,实现多模态数据的语义对齐。以此方式,增强了语义表征的准确性,且多模态数据在统一语义空间中的对齐效果显著。
本发明授权基于跨模态注意力机制的多模态数据语义对齐方法及装置在权利要求书中公布了:1.一种基于跨模态注意力机制的多模态数据语义对齐方法,其特征在于,包括: 获取多模态数据及其对应的类别标签,并通过预先训练好的多模态编码器将所述多模态数据映射为多模态嵌入向量; 根据多模态大语言模型生成与所述多模态数据对应的文本描述,并结合所述类别标签对所述文本描述进行筛选,构建多模态知识库; 基于所述多模态知识库,构建包含基础提示词嵌入中心、多模态知识库嵌入中心和大语言模型嵌入中心的多元嵌入中心; 通过跨模态注意力机制,将所述多模态嵌入向量与所述文本描述进行交互,生成语义增强后的多模态嵌入向量; 将所述语义增强后的多模态嵌入向量与所述多元嵌入中心进行对比学习,实现多模态数据的语义对齐; 所述基于所述多模态知识库,构建包含基础提示词嵌入中心、多模态知识库嵌入中心和大语言模型嵌入中心的多元嵌入中心,包括: 从所述多模态知识库中选择与所述类别标签余弦相似度最高的前N个文本描述,通过文本编码器对所述前N个文本描述进行均值聚合,生成多模态知识库嵌入中心; 通过动态模板生成器将预设的静态提示模板扩展为多模态动态提示词集,并通过文本编码器映射为嵌入向量,生成基础提示词嵌入中心; 根据大语言模型生成与所述类别标签相关的抽象语义描述,并对所述抽象语义描述进行筛选,并通过文本编码器将筛选后的抽象语义描述映射为嵌入向量,生成大语言模型嵌入中心; 将所述多模态知识库嵌入中心与基础提示词嵌入中心及大语言模型嵌入中心融合,形成多元嵌入中心。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人贵州大学,其通讯地址为:550025 贵州省贵阳市花溪区贵州大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励