当前位置 : 首页 > 专利喜报 > 天津大学程增木获国家专利权

天津大学程增木获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉天津大学申请的专利一种基于多模态注意力融合的端到端自动驾驶方法及系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN121224768B 。

龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202511788173.9，技术领域涉及：B60W60/00；该发明授权一种基于多模态注意力融合的端到端自动驾驶方法及系统是由程增木;董娜;郭振栋设计研发完成，并于2025-12-01向国家知识产权局提交的专利申请。

本一种基于多模态注意力融合的端到端自动驾驶方法及系统在说明书摘要公布了：本发明涉及智能交通与人工智能技术领域，公开了一种基于多模态注意力融合的端到端自动驾驶方法及系统，其中，一种基于多模态注意力融合的端到端自动驾驶方法包括：采集多模态数据；生成初始语义文本并对初始语义文本进行校准形成校准后的语义文本；对多视角摄像头采集的环境图像和点云数据进行特征处理，将校准后的语义文本和第一BEV特征进行跨模态对齐，并进行时空特征建模；生成候选轨迹，量化每个候选轨迹与动态障碍物的碰撞风险，筛选出低风险轨迹，通过规则掩码引导低风险轨迹优化；将优化后的轨迹映射为控制指令；本发明利用CLIP跨模态对齐机制，将文本特征与BEV几何特征深度融合，提升关键区域的识别准确率。

本发明授权一种基于多模态注意力融合的端到端自动驾驶方法及系统在权利要求书中公布了：1.一种基于多模态注意力融合的端到端自动驾驶方法，其特征在于，包括：实时采集前方道路高清图像和驾驶意图数据并生成初始语义文本，通过MLP网络对所述初始语义文本进行语义校准，抑制视觉语言模型的幻觉问题，输出包含关键语义实体及其空间位置的待处理语义文本；其中，所述语义校准的过程为：；其中表示校准后的文本语义特征向量；为ReLU激活函数；和分别表示第一层全连接权重矩阵和第二层全连接权重矩阵；表示输入图像特征向量；和分别表示第一层偏置向量和第二层偏置向量；基于多视角摄像头采集的环境图像和激光雷达采集的点云数据进行特征处理并生成第一BEV特征，采用CLIP模型将所述待处理语义文本和所述第一BEV特征进行跨模态对齐，通过可学习的残差调制模块，将降维后的文本特征与第一BEV特征在特征通道层面进行加权融合，实现语义与几何特征的显式对齐，并进行时空特征建模，输出融合时空信息的第二BEV特征；其中，所述采用CLIP模型将所述待处理语义文本和所述第一BEV特征进行跨模态对齐包括：使用CLIP模型的文本编码器对待处理语义文本进行编码，生成高维文本特征向量；通过线性层将文本特征降维至预设维，冻结CLIP视觉编码器，仅保留文本编码器参数，将降维后的文本特征映射至BEV特征空间；将所述第二BEV特征输入条件变分自编码器生成候选轨迹，基于高斯混合模型构建概率占用场，量化每个所述候选轨迹与动态障碍物的碰撞风险，筛选出低风险轨迹，基于所述待处理语义文本生成规则掩码，并通过规则掩码引导所述低风险轨迹优化，动态调整所述低风险轨迹的轨迹参数；其中，所述生成候选轨迹是利用条件变分自编码器生成多组候选轨迹，并通过KL散度损失约束轨迹多样性，覆盖驾驶意图；将优化后的轨迹映射为控制指令，实现端到端的自动驾驶控制。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人天津大学，其通讯地址为：300072 天津市南开区卫津路92号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

天津大学程增木获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务