浙江大学耿卫东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种通用预训练图结构大模型的构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121503545B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610040223.3,技术领域涉及:G06N3/0455;该发明授权一种通用预训练图结构大模型的构建方法及系统是由耿卫东;马晓峰设计研发完成,并于2026-01-13向国家知识产权局提交的专利申请。
本一种通用预训练图结构大模型的构建方法及系统在说明书摘要公布了:本发明公开了一种通用预训练图结构大模型的构建方法和系统,属于图计算技术领域,包括:从多源文本属性图数据中构建包含文本属性子图和节点文本属性的样本集;采用基于欧拉路径的可逆序列化方式改进方式对图结构编码器进行预训练,得到图结构表征;采用文本特征编码器将节点文本属性编码为文本语义表征,将图结构表征和文本语义表征通过映射网络征映射到同一对齐空间后,基于文本语义表征和图结构表征构建联合全局表征对齐任务、子结构‑短语级的局部语义对齐任务、以及图到文本重建任务,训练映射网络,得到通用预训练图结构大模型,这样可以有效弥合了图结构与文本语义之间的模态鸿沟,显著提升了模型在下游任务中的泛化能力与推理可信度。
本发明授权一种通用预训练图结构大模型的构建方法及系统在权利要求书中公布了:1.一种通用预训练图结构大模型的构建方法,其特征在于,包括以下步骤: 获得多源文本属性图数据经预处理后,构建包含文本属性子图和节点文本属性的样本集; 采用基于欧拉路径的可逆序列化方式将每个文本属性子图转换为连续的一维图Token序列;以一维图Token序列作为输入,采用调度掩码Token预测作为自监督训练目标,对图结构编码器进行预训练,得到具备通用拓扑理解能力的图结构表征; 采用文本特征编码器将文本属性子图对应的节点文本属性编码为文本语义表征,将图结构表征和文本语义表征通过映射网络征映射到同一对齐空间后,基于同一对齐空间的文本语义表征和图结构表征构建多层次跨模态损失,联合全局表征对齐任务、子结构-短语级的局部语义对齐任务、以及图到文本重建任务,训练映射网络,得到由图结构编码器、文本特征编码器、映射网络、以及引入用作解码的语言模型组成的通用预训练图结构大模型; 所述多层次跨模态损失包含联合全局表征对齐任务对应的全局表征对齐损失、子结构-短语级的局部语义对齐任务对应的局部语义对齐损失、以及图到文本重建任务对应的重建损失; 针对全局表征对齐任务,参考对比学习采用InfoNCE损失来构建全局表征对齐损失,其包含基于归一化后图结构表征与归一化后文本语义表征,从图到文方向定义的InfoNCE损失和从文到图方向定义的InfoNCE损失; 针对子结构-短语级的局部语义对齐任务,构建的局部语义对齐损失包括基于结构token与文本token之间匹配程度构建的token级匹配损失,还包括基于归一化后子结构表征与归一化后局部文本语义表征,从图到文方向定义的InfoNCE损失和从文到图方向定义的InfoNCE损失,其中子结构表征为对文本属性子图进行划分得到的子结构经过图结构编码器和映射网路得到的表征,局部文本语义表征为对节点文本属性提取的文本片段经过文本特征编码器和映射网络得到的表征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励