武汉大学刘金硕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利一种基于数据增强及图匹配网络的文本匹配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115510841B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211131717.0,技术领域涉及:G06F40/194;该发明授权一种基于数据增强及图匹配网络的文本匹配方法是由刘金硕;张思奇;邓娟;詹岱依;刘宁;王晨阳;黄朔;唐浩洲;柳凯设计研发完成,并于2022-09-16向国家知识产权局提交的专利申请。
本一种基于数据增强及图匹配网络的文本匹配方法在说明书摘要公布了:本发明公开了一种基于数据增强及图匹配网络的文本匹配方法,引入依存句法分析,建立文本语义单元之间的依赖关系。利用自注意力机制,使模型聚焦于核心语义单元。通过图匹配网络,在两段文本任意词之间建立连接,通过注意力机制进行充分的交互,更好地把握语义焦点,学习文本之间的相似性。从字词、句子粒度实现问句匹配数据集的数据增强。设计实体替换算法、同义词替换及随机插入算法、字词噪声增强算法以及回译算法提高了数据集的多样性,解决了语料不足等问题。本发明将依存句法分析与图匹配网络相结合,在问句文本数据集上超越了当前的多个基线模型,提出的面向问句匹配的数据增强算法能够有效提高模型在问句匹配任务上的鲁棒性以及匹配效果。
本发明授权一种基于数据增强及图匹配网络的文本匹配方法在权利要求书中公布了:1.一种基于数据增强及图匹配网络的文本匹配方法,其特征在于,包括以下步骤: 步骤1:将待匹配的两段文本,对文本词性以及专有名词进行识别及标注处理,同时从字词粒度和句子粒度对待匹配的两段文本进行数据增强处理; 步骤2:对数据增强处理后的两段待匹配文本经过上下文编码,将文本映射为语义编码表示,并通过池化操作,得到词语的表示; 步骤3:对两段待匹配文本分别进行依存句法分析,得到文本中不同语义单元之间的依存关系图; 步骤4:在两段待匹配文本的依存关系图上,对图节点的邻域节点执行卷积操作,并通过自注意力机制,对邻域节点分配不同的权重,得到消息向量; 步骤5:将步骤4中的消息向量与对照文本的依存关系图节点进行跨图信息交互,通过注意力机制,得到跨图信息匹配消息向量; 步骤6:利用步骤4中的消息向量和步骤5中的跨图信息匹配消息向量,对节点进行聚合更新,经过若干轮次的消息传播与聚合更新,得到图节点的最终表示; 步骤7:由图匹配网络,预测图级别表征向量之间的相似度,获得匹配结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区珞珈山街道八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。