SAP欧洲公司M.弗兰克获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉SAP欧洲公司申请的专利用于匹配半结构化数据中的实体的深度神经网络获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114202053B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110804694.4,技术领域涉及:G06N3/0464;该发明授权用于匹配半结构化数据中的实体的深度神经网络是由M.弗兰克;H-V.阮;S.K.鲍尔;A.斯特雷尔索夫;J.曼卡德;C.古德;K.申克;P.L.詹西科夫;R.K.古普塔设计研发完成,并于2021-07-16向国家知识产权局提交的专利申请。
本用于匹配半结构化数据中的实体的深度神经网络在说明书摘要公布了:在示例实施例中,可以使用深度神经网络来确定候选实体对之间的匹配、以及反映深度神经网络关于对应匹配的确定程度的置信度分数。深度神经网络还能够找出这些匹配,而无需如果手工完成机器学习模型的特征所需的领域知识,这是用于匹配多个表中的实体的现有技术机器学习模型的缺点。因此,深度神经网络对被设计用于执行相同任务的现有技术机器学习模型的运行有了改进。具体而言,深度神经网络仅从历史数据学习定义匹配的表格字段与模式之间的关系,从而使该方法独立于上下文通用并适用。
本发明授权用于匹配半结构化数据中的实体的深度神经网络在权利要求书中公布了:1.一种系统,包括: 至少一个硬件处理器;以及 非暂时性计算机可读介质,存储指令,当由所述至少一个硬件处理器执行时,所述指令使所述至少一个硬件处理器执行操作,所述操作包括: 获得第一表中的第一实体,其中,所述第一表为数据库中的表,所述第一实体包括多个字段的值; 将所述多个字段中的一个或多个字段中的值标记化为一个或多个标记; 将所述一个或多个标记中的每一者传递给通过第一机器学习算法训练的嵌入机器学习模型以生成用于输入的n维空间中的一组坐标,从而产生包括所述一个或多个标记中的每一者的坐标的嵌入; 将所述一个或多个标记以及所述第一实体中的所述多个字段中的所述一个或多个字段中的每一者的所述嵌入连接成第一矩阵; 构造所述第一实体的起始字段序列,针对所述第一实体中的所述多个字段中的所述一个或多个字段中每一者的所述一个或多个标记中的每一者,所述起始字段序列包括与从中生成标记的所述值的字段相对应的标识; 将所述起始字段序列中的每一值传递到所述嵌入机器学习模型中以生成所述起始字段序列中的每一值的一组坐标; 将所述起始字段序列中的每一值的所述嵌入连接成第二矩阵; 堆叠所述第一矩阵及所述第二矩阵以形成第三矩阵;以及 将所述第三矩阵传递给可分解注意力神经网络以比较所述第一实体与由其自身的嵌入矩阵表示的第二实体, 其中,所述操作还包括: 将所述第一实体中的所述多个字段分类成三类字段:基于文本的字段、分类字段以及数值日期字段,并且其中所述多个字段中的所述一个或多个字段是所述基于文本的字段,以及 将所述分类字段的值传递给后面跟着第一前馈神经网络的第二嵌入机器学习模型,以及 其中,所述操作还包括: 确定所述第一实体与所述第二实体之间的匹配,以及 去除所述第一实体和所述第二实体中的一个,或者组合所述第一实体和所述第二实体,从而减小存储容量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人SAP欧洲公司,其通讯地址为:德国瓦尔多夫;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励