西安交通大学田锋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安交通大学申请的专利基于降噪邻域聚合的文本细粒度类别发现方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117216274B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311194250.9,技术领域涉及:G06F16/35;该发明授权基于降噪邻域聚合的文本细粒度类别发现方法及相关装置是由田锋;安文斌;施文楷;陈妍;武亚强设计研发完成,并于2023-09-15向国家知识产权局提交的专利申请。
本基于降噪邻域聚合的文本细粒度类别发现方法及相关装置在说明书摘要公布了:本发明属于自然语言处理领域,公开了一种基于降噪邻域聚合的文本细粒度类别发现方法及相关装置,包括:迭代更新步骤预设次数,将最终的文本特征提取器作为优化文本特征提取器;采用优化文本特征提取器依次提取各文本的特征,得到若干优化文本特征;并将若干优化文本特征进行聚类得到若干聚类簇,以及获取各聚类簇的簇标签并将各聚类簇的簇标签作为各聚类簇中各文本的细粒度类别。根据特征相似的文本具有相同的细粒度类别这一原理,在更新步骤中,利用粗粒度标签约束、互为近邻约束和排序统计量约束这三种近邻约束,获得文本特征的降噪近邻集合即最终近邻集合,并使用多正样本对比学习使得文本特征和其近邻动量特征具有相似的表征,有效提高文本的细粒度类别的准确性。
本发明授权基于降噪邻域聚合的文本细粒度类别发现方法及相关装置在权利要求书中公布了:1.一种基于降噪邻域聚合的文本细粒度类别发现方法,其特征在于,包括: 迭代更新步骤预设次数,将最终的文本特征提取器作为优化文本特征提取器; 采用优化文本特征提取器依次提取各文本的特征,得到若干优化文本特征;并将若干优化文本特征进行聚类得到若干聚类簇,以及获取各聚类簇的簇标签并将各聚类簇的簇标签作为各聚类簇中各文本的细粒度类别; 其中,更新步骤包括: 通过动量特征提取器提取所有文本的动量特征,得到动量集合;以及使用文本特征提取器依次提取各文本的特征,得到若干文本特征; 遍历各文本特征,从动量集合中选取与当前文本特征相似度前预设数量高的动量特征并组合,得到各文本特征的初始近邻集合;利用粗粒度标签约束过滤初始近邻集合中与文本特征具有不同粗粒度标签的动量特征,得到各文本特征的一次过滤近邻集合;利用互为近邻约束过滤一次过滤近邻集合中与文本特征不是互为近邻的动量特征,得到各文本特征的二次过滤近邻集合;利用排序统计量约束过滤二次过滤近邻集合中与文本特征对应的文本的n阶排序统计量不同的动量特征,得到各文本特征的最终近邻集合;其中,n为排序统计量的阶数; 根据动量集合和各文本特征的最终近邻集合,使用多正样本对比学习更新文本特征提取器的参数以及动量特征提取器的参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安交通大学,其通讯地址为:710049 陕西省西安市碑林区咸宁西路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。