北京航空航天大学;山东高速集团有限公司崔志勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学;山东高速集团有限公司申请的专利一种面向高速异常曝光场景的多模态大模型上下文理解方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120182117B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510660658.3,技术领域涉及:G06T5/60;该发明授权一种面向高速异常曝光场景的多模态大模型上下文理解方法是由崔志勇;左志武;彭梓熙;李晨曦;李睿楷;平振东;王梓赫;吕梦琪;范一哲;于海洋设计研发完成,并于2025-05-22向国家知识产权局提交的专利申请。
本一种面向高速异常曝光场景的多模态大模型上下文理解方法在说明书摘要公布了:本发明涉及智慧交通技术领域,公开了一种面向高速异常曝光场景的多模态大模型上下文理解方法,第一步,针对视频数据的复杂时空结构,采用旋转位置嵌入(RoPE)变体进行编码获得时序特征,第二步,将时序特征与文本特征结合,形成时序+文本的多模态数据输入,第三步,根据输入的多模态数据特征动态预测拉普拉斯金字塔分解核的权重,第四步,在特征金字塔的每一层对特征进行提炼和转换,逐层重建至原始分辨率,生成校正后的图像,第五步,在训练过程中,结合像素重建损失、对抗性损失和内核损失,优化模型参数,第六步,将校正后的图像输入事件理解模块,识别并分类场景中的各类事件,实现语义理解。
本发明授权一种面向高速异常曝光场景的多模态大模型上下文理解方法在权利要求书中公布了:1.一种面向高速异常曝光场景的多模态大模型上下文理解方法,其特征在于:包括以下步骤: S1,对视频数据的复杂时空结构进行编码,提取时序特征; S2,将所述时序特征与文本特征融合,形成多模态输入数据; S3,基于多模态输入数据动态预测拉普拉斯金字塔分解核的权重; S4,通过多层级特征金字塔分解与重建生成校正后的图像; S5,结合多分量损失函数优化模型参数; S6,基于校正后的图像识别并分类场景事件,实现语义理解; 所述步骤S1包括: S101,获取视频数据的时空序列,包含时间轴上的连续视频帧及其空间像素分布; S102,构建旋转位置嵌入变体编码器,通过低频时间分配策略对时空位置进行非对称维度映射; S103,采用对角线布局生成时空位置编码矩阵,使视觉标记间的相对位置关系与文本标记的旋转位置编码保持对称性约束; S104,提取时序特征,得到视觉特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学;山东高速集团有限公司,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。