合肥工业大学张春菊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利顾及时间段特征的地理知识图谱隐式推理模型构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118982071B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411075181.4,技术领域涉及:G06N5/04;该发明授权顾及时间段特征的地理知识图谱隐式推理模型构建方法是由张春菊;徐兵;周康;王曙;诸云强;黄建伟;褚超群设计研发完成,并于2024-08-07向国家知识产权局提交的专利申请。
本顾及时间段特征的地理知识图谱隐式推理模型构建方法在说明书摘要公布了:本发明涉及地理知识图谱嵌入技术领域,具体公开了顾及时间段特征的地理知识图谱隐式推理模型构建方法,包括以下步骤:首先构建多尺度的地质样品数据集;而后建立顾及时间段特征的隐式推理模型;最后通过评价指标和分析实验结果,对模型性能进行评价。本发明采用上述的顾及时间段特征的地理知识图谱隐式推理模型构建方法,针对现有时间编码器提取时间段特征能力不足的问题,构建了面向时间段编码的地理逻辑查询问答。解决了现有时间编码器对时间段信息以及多尺度时间信息处理的局限性,构建了面向时间段特征的时间段编码器,采用地质样品数据集验证了时间段编码器的有效性及其在下游任务中的性能。
本发明授权顾及时间段特征的地理知识图谱隐式推理模型构建方法在权利要求书中公布了:1.顾及时间段特征的地理知识图谱隐式推理模型构建方法,其特征在于,包括以下步骤: S1、构建多尺度的地质样品数据集; S2、建立顾及时间段特征的隐式推理模型; S3、通过评价指标和分析实验结果,对模型性能进行评价; 步骤S1具体包括以下步骤: S11、数据来源: 地质样品数据集中包含不同的地质样品数据,每一条记录反映了样品的岩性代码、岩性编号以及其具体的地理位置,包括样品所在的大陆、国家和经纬度,以及与其地理位置相关的备注信息; 对于每一条样品,采用地质时间判读算法获取地质样品所参考的地质年代图谱和具体的开始时间、结束时间和相应的不确定度; S12、数据预处理: 地质样品数据集中的每条样品记录了所对应的时间信息:由Start和End列表示的样品的地质时代时间以及PrimaryReference列中的时间,数据预处理具体过程包括: 将Start和End列中的数据转换为通用的年份格式和表达形式,Start和End列中时间单位是百万年前Ma,将该数据乘以-1×106; 对于PrimaryReference列中的时间,采用正则表达式提取该列中的年份,在提取了所有的时间之后,转换成通用的年月日时分秒的表达形式; 通过创建一个递增的整数序列NewIDNumber,为每条记录分配一个唯一ID,作为样品名称来连接地理位置、时间信息、岩性描述; S13、知识图谱构建: 确定知识图谱中的实体和实体之间的关系,通过指定每列实体之间的关系,构成三元组转化为图谱中的节点和边;通过时间标签的归一化和地理坐标的映射,完成样品节点的属性赋值; S14、问答数据集构建: 将知识图谱中的三元组按照90:9:1的比例划分训练集、测试集和验证集,采样后构建地质样品数据集的查询问答对LQA; 步骤S2具体包括以下步骤: S21、设计面向时间段特征的时间编码器Encp; 编码具有复杂时间属性的时间段,时间段特征包括开始时间、结束时间、跨度和周期性,将时间点视为特殊的时间段,即时间段的开始时间等于结束时间;对于时间点和时间段这两种维度的时间信息,将时间点采用时间段的形式进行表达,即进行升维; 时间段的特征提取与组合将从时间尺度调节、周期性编码和时间段跨度编码三个方面进行考虑; S22、构建顾及时间段特征的地理知识图谱隐式推理模型; 顾及时间段特征的地理知识图谱隐式推理模型TFKGEperiod包括三个部分:实体编码器、投影算子和交集算子;其中,实体编码器由实体特征编码器和时间段特征编码器组成,分别对知识图谱的实体特征和时间段特征进行编码,然后组合为包含时间段特征的实体向量;通过投影算子计算实体向量在关系向量上的投影得到结果向量,并且通过交集算子对多个结果向量进行计算,得到最终的目标向量;最后,通过最近邻搜索得到要推理的目标节点; S23、模型训练; 在新构建的地质样品数据集的基础上训练TFKGEperiod模型以及多个参数模型,而后在Yago15k数据集上与基线模型进行对比,测试TFKGEperiod模型在地理逻辑问答任务上的贡献; 步骤S21中,所述时间尺度调节具体过程如下: 通过对时间值应用不同的对数函数来缩小开始和结束时间的尺度,定义两种时间缩放函数St: 第一种基于对数调整的数量级缩放方法Slt,具体过程如下: 首先采用对数函数确定一个基准值,然后根据这个基准值对所有数据进行缩放,保留原始数据的相对大小关系;通过结合对数变换和数量级缩放,减轻跨尺度时间数据在输入深度学习模型时可能导致的数量级差异: 其中,表示向下取整操作,tmin表示数据集中最小的时间值或手动指定的参考值; 第二种绝对值对数变换法Skt,具体过程如下: 通过使用绝对值∣t∣,确保即使t为负值,∣t∣+c也是正的,使得函数取值在定义域内,通过对数转换logk,时间数据被映射到一个新的尺度: Skt=logk|t|+c2 其中,k和c是经过调整的参数,用于控制缩放的程度和偏移; 步骤S21中,所述周期性编码具体为: 采用正弦和余弦函数来编码时间的周期性,周期性编码函数Pt,如下所示: Pt=[sinωt,cosωt]3 其中,ω表示周期性的角频率向量,用于捕获时间t中不同粒度的周期性; 步骤S21中,所述时间段跨度编码具体为: 采用嵌入组合和嵌入差异方法来捕获时间段的跨度和长度信息,嵌入组合方法是通过开始时间嵌入和结束时间嵌入组合起来,获得时间段开始时间和结束时间绝对位置的嵌入; 嵌入差异方法是通过计算开始时间和结束时间嵌入的均值和差异,来捕捉时间段的长度和跨度; 结合使用嵌入组合和嵌入差异两种方法,通过时间段的开始时间和结束时间来捕获时间段中丰富的特征: Eavg=Estart+Eend24 Ediff=Eend-Estart5 其中,Estart表示时间段的开始时间的嵌入向量,Eend表示时间段的结束时间的嵌入向量,Eavg表示时间段嵌入向量的均值,Ediff表示时间段的结束时间嵌入与开始时间嵌入的差异; 将Estart、Eend、Ediff、Eavg以及周期性编码Pt组合在一起,形成一个综合的特征向量Eperiod,然后将该特征向量送入前馈神经网络进行训练,得到最终的时间段编码Etime: Eperiod=[Estart;Eend;Ediff;Eavg;Ptstart;Ptend]6 Etime=NNEperiod7 其中,NN表示前馈神经网络,[;]表示向量的串联操作,Ptstart和Ptend分别表示开始时间和结束时间的周期性编码。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。