山东师范大学武晨宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东师范大学申请的专利基于语言引导和图Transformer的场景草图语义分割方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121074579B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511293395.3,技术领域涉及:G06V10/80;该发明授权基于语言引导和图Transformer的场景草图语义分割方法及系统是由武晨宇设计研发完成,并于2025-09-11向国家知识产权局提交的专利申请。
本基于语言引导和图Transformer的场景草图语义分割方法及系统在说明书摘要公布了:本发明提供一种基于语言引导和图Transformer的场景草图语义分割方法及系统,涉及计算机视觉技术领域,该方法包括:获取场景草图的笔画序列数据;对笔画序列数据进行多模态特征提取,分别获得每个笔画的纹理特征、语义特征和几何特征;将三个特征通过跨模态注意力机制进行融合,获得每个笔画的融合后特征表示;基于笔画间的空间或时序邻接关系构建图结构,节点为笔画,边为邻接关系,将融合后特征表示作为节点的初始特征;将图结构输入图Transformer编码器进行消息传递与节点特征更新,得到更新后的节点特征;基于更新后的节点特征,对每个笔画进行语义类别预测,完成场景草图的语义分割。
本发明授权基于语言引导和图Transformer的场景草图语义分割方法及系统在权利要求书中公布了:1.一种基于语言引导和图Transformer的场景草图语义分割方法,其特征在于,包括: 获取场景草图的笔画序列数据; 对所述笔画序列数据进行多模态特征提取,分别获得每个笔画的纹理特征、语义特征和几何特征;所述语义特征通过预训练的语言-视觉模型的文本编码器生成;在训练阶段,使用真实的类别标签文本输入所述文本编码器以生成语义特征:;在推理阶段,使用所有N个预设类别标签文本的嵌入向量的均值作为代理语义特征:; 将所述纹理特征、语义特征和几何特征通过跨模态注意力机制进行融合,获得每个笔画的融合后特征表示; 所述跨模态注意力机制的执行步骤包括: 将所述纹理特征和语义特征分别经线性投影权重矩阵和变换后相加,生成查询向量; 将所述几何特征分别经线性投影权重矩阵和变换,生成键向量和值向量,其中,; 计算查询向量Q与键向量K的缩放点积相似度,经softmax函数归一化后得到注意力权重; 使用所述注意力权重对值向量V进行加权求和,得到融合后的特征输出,其中为键向量的维度; 基于笔画间的空间或时序邻接关系构建图结构,其中节点为笔画,边为邻接关系,并将所述融合后特征表示作为节点的初始特征; 将所述图结构输入图Transformer编码器进行消息传递与节点特征更新,得到更新后的节点特征; 基于所述更新后的节点特征,对每个笔画进行语义类别预测,完成场景草图的语义分割。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东师范大学,其通讯地址为:250014 山东省济南市历下区文化东路88号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励