广西师范大学韩亚丹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广西师范大学申请的专利一种基于可变翻译的时空知识图谱嵌入方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117216295B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311226561.9,技术领域涉及:G06F16/36;该发明授权一种基于可变翻译的时空知识图谱嵌入方法是由韩亚丹;陆广泉;马俊波;张文振;凌富清设计研发完成,并于2023-09-22向国家知识产权局提交的专利申请。
本一种基于可变翻译的时空知识图谱嵌入方法在说明书摘要公布了:本发明公开了一种基于可变翻译的时空知识图谱嵌入方法,包括如下步骤:1构建TKGE‑VT模型;2设计损失函数;3构造负三元组;4模型训练。这种方法放宽了传统翻译原则的严格约束,实现了实体和关系嵌入之间的灵活转换;还融入了三元组中实体和关系的时间属性,并将所提出的可变翻译原则应用于时空知识图谱。
本发明授权一种基于可变翻译的时空知识图谱嵌入方法在权利要求书中公布了:1.一种基于可变翻译的时空知识图谱嵌入方法,其特征在于,包括如下步骤: 1构建TKGE-VT模型: 1.1构造可变翻译原则:可变翻译原则的关键在于对实体和关系的嵌入提供更大的自由度,以放宽传统翻译原则的严格约束,使得TKGE-VT模型能够更好地对实体和关系进行建模:对于给定的头实体和关系,引入辅助参数将尾实体的嵌入范围设定为一个平面,且不是一个固定的向量,而是位于同一方向上的一组大小不同的向量,同理,对于给定的头实体和尾实体,引入辅助参数将关系的嵌入范围设定为一个平面,且不是一个固定的向量,而是一组方向相同大小不同的向量,对于给定的尾实体和关系,引入辅助参数将头实体的嵌入范围设定为一个平面,且不是一个固定的向量,而是一组方向相同大小不同的向量,构造的可变翻译原则为:,其中,、和是头实体向量、关系向量和尾实体向量的辅助参数,分别将头实体、关系和尾实体的嵌入范围设定为一个平面,、和作为超参数分别用来调整、和的大小; 1.2在可变翻译原则中引入随机数:考虑到随机误差问题,即若不等于,不等于,也不等于时,引入随机数、和来调整随机误差; 1.3融入实体和关系的时间属性:知识图谱中的许多事实是动态的,这些动态事实通常只适用于某一特定时间段或时间戳,即知识图谱中的三元组事实具有时间属性,因此,在TKGE-VT模型中,融入三元组的时间属性,分别学习三元组中实体和关系的时间感知嵌入,并分别将学习到的头实体的时间感知嵌入表示为,尾实体的时间感知嵌入表示为,关系的时间感知嵌入表示为,因此,具有时间感知嵌入的头实体表示为,具有时间感知嵌入的尾实体表示为,具有时间感知嵌入的关系表示为; 1.4设计TKGE-VT模型的评分函数:设计一个评分函数来对正三元组和负三元组进行评分,通过评分函数,正三元组的得分将小于负三元组的得分,以此来测试TKGE-VT模型的性能,将基于可变翻译的时空知识图谱嵌入模型—TKGE-VT的评分函数设计为:,其中,和均表示正则化; 2设计损失函数:在对TKGE-VT模型训练时,需要设计一个损失函数来描述三元组的预测值和真实值之间的差距,用来表示损失函数,通过损失函数迭代,以优化模型的预测和分类效果,同时更新模型的参数,使用以下基于边际的排名损失函数: 其中,是正三元组得分,是负三元组得分,是一个超参数,表示正三元组和负三元组的边际,在训练时,通过不断调整边际的值将正三元组得分和负三元组得分的差异最大化,从而优化模型的预测和分类效果; 3构造负三元组: 3.1使用概率法替换头实体或尾实体:在训练TKGE-VT模型时,需要根据正三元组和负三元组进行判别训练,并对正三元组和负三元组的得分进行排序,为了提高生成的负三元组的质量,使用概率法来构造负样本,用不同的概率来替换头实体或尾实体,即根据关系的类型设置不同的替换策略,其中关系类型主要是一对多和多对一,替换策略为:对于一对多关系,即一个头实体对应多个尾实体,以更高的概率替换头实体;对于多对一关系,即多个头实体对应一个尾实体,以更高的概率替换尾实体,一个实体有多个属性,在处理一对多关系时,替换头实体能使头实体的每个属性都得到充分的训练,在处理多对一关系时,替换尾实体能使尾实体的每个属性也得到充分的训练; 3.2选择语义相近的实体进行替换:在向量空间中,相同类型的实体分布在相近的区域,因此,在替换正三元组的头实体和尾实体生成负三元组时,使用语义相似的实体来替换,以提高模型对实体的区分度; 4模型训练: 4.1基于可变翻译的时空知识图谱嵌入的链接预测:对于链接预测,给定一个三元组或者,链接预测任务是根据三元组中已知的事实来预测缺失的或:首先将每个三元组的头实体随机替换成其他实体,然后使用在步骤1.4中设计的评分函数来计算每个三元组的得分,根据得分按照从低到高的顺序对三元组进行排序,记录原始正确的三元组排名,然后对尾实体也做与头实体同样的处理,最后,选择得分最小的三元组中的实体作为缺失三元组的头实体或尾实体; 4.2基于可变翻译的时空知识图谱嵌入的三元组分类:对于三元组分类,给定一个三元组,三元组分类任务通过模型学习到的知识表示来判断该三元组是否正确,即是否属于知识图谱中存在的事实三元组,这是一个二元分类任务,同时也是知识图谱补全的经典任务之一:首先需要设置一个特定于关系的阈值,对于给定的三元组,若通过评分函数计算得到的分数小于设定的阈值,则该三元组将被判定为正三元组,否则,为负三元组。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广西师范大学,其通讯地址为:541004 广西壮族自治区桂林市七星区育才路15号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。