中国人民解放军战略支援部队信息工程大学贾萌萌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军战略支援部队信息工程大学申请的专利面向跨语言知识图谱的弱监督实体对齐优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116108351B 。
龙图腾网通过国家知识产权局官网在2026-01-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310055330.X,技术领域涉及:G06F18/214;该发明授权面向跨语言知识图谱的弱监督实体对齐优化方法及系统是由贾萌萌;刘琰;刘粉林;郭晓宇;吴文昊设计研发完成,并于2023-01-16向国家知识产权局提交的专利申请。
本面向跨语言知识图谱的弱监督实体对齐优化方法及系统在说明书摘要公布了:本发明公开一种面向跨语言知识图谱的弱监督实体对齐优化方法及系统,该方法在标记数据缺失的条件下引入基于邻域关系和语义字符的轻量级无监督模块挖掘参与有监督训练的候选种子集,综合语义字符级距离度量评价候选种子集的可信度,并以该可信度为参考依据优化模型联合训练损失函数,从而实现了候选种子集与标记数据的联合训练,由此降低有监督算法对标记数据的依赖性。在DBP15K上的实验表明,本发明可以有效降低标记数据的规模,仅依靠10%有标记数据就可以达到与Dual‑AMN方法相近的准确率,与基线方法相比,本发明方法在Hit@1值上的性能至少提高了3%。
本发明授权面向跨语言知识图谱的弱监督实体对齐优化方法及系统在权利要求书中公布了:1.一种面向跨语言知识图谱的弱监督实体对齐优化方法,其特征在于,包括: 步骤1:提取跨语言知识图谱中实体的邻域关系和语义字符信息,使用相似度计算得到初步的候选种子集; 步骤2:综合语义和字符信息对候选种子集进行可信度评估,找到可靠性较高的候选种子; 步骤3:将优化选择出的候选种子和部分标记数据一起进行联合训练; 步骤4:利用得到的可信度改进损失函数,最终优化整个训练过程; 所述步骤1包括: 使用稀疏矩阵来存储知识图谱中的实体和关系信息,得到邻居信息矩阵,其中,矩阵中的对角信息取所有三元组数量与实体数量的比值,表示与自己相连的实体之间的权重; 按照下式计算实体之间的权重信息: 1 其中,表示三元组数量,代表实体和实体之间的关系在所有三元组中出现的次数,权重越高,表示两个实体之间的联系越紧密; 对于源和目标两个跨语言知识图谱,首先使用机器翻译系统将非英文的属性名翻译成英文;然后用Glove词嵌入得到属性名的语义级平均词向量,使用平均词向量代表实体名的语义信息;对于每个属性名,以两个字符为单位进行分割,得到字符级别的嵌入向量;最后对得到的语义和字符级向量,使用余弦相似度函数分别计算两个知识图谱的语义和字符级的相似度,获得初步的候选种子集; 所述步骤4包括: 在训练过程中为优化选择出的候选种子中每对实体赋予权重信息,将标记数据的权重得分设置为1,通过固定均值和方差的样本损失来减少对样本规模和超参数的依赖,以完成对损失函数的改进,最终优化整个训练过程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军战略支援部队信息工程大学,其通讯地址为:450000 河南省郑州市高新区科学大道62号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励