平安科技(深圳)有限公司王烨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利文本聚类方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116521867B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310381393.4,技术领域涉及:G06F16/353;该发明授权文本聚类方法、装置、电子设备及存储介质是由王烨;王燕蒙;李剑锋;王少军设计研发完成,并于2023-04-04向国家知识产权局提交的专利申请。
本文本聚类方法、装置、电子设备及存储介质在说明书摘要公布了:本发明涉及人工智能技术,揭露了一种文本聚类方法,包括:利用语义识别模型对获取的待聚类数据集进行语义识别操作,并对语义识别结果进行聚类操作,得到聚类簇集合;依次计算聚类簇集合中语义向量到对应的聚类中心的距离;当距离不满足聚类距离条件时,调整语义识别模型的参数,并再次进行语义识别操作,得到调整语义向量集;对调整语义向量集进行聚类操作,得到调整聚类簇集合,在所述调整聚类簇集合与所述聚类簇集合之间的聚类数据差异度满足预设的差异条件时,退出上述语义识别操作和聚类操作,将最后一次聚类簇集合作为待聚类数据集的聚类结果。本发明还提出一种文本聚类装置、电子设备以及存储介质。本发明可以提高文本聚类的准确性。
本发明授权文本聚类方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种文本聚类方法,其特征在于,所述方法包括: 获取待聚类数据集,利用预设的语义识别模型对所述待聚类数据集进行语义识别操作,得到语义向量集; 对所述语义向量集进行聚类操作,得到聚类簇集合; 依次计算所述聚类簇集合中每个聚类簇下每个语义向量到对应的聚类中心的距离; 在所述距离不满足预设的聚类距离条件时,调整所述预设的语义识别模型的参数,并利用调整后的语义识别模型对所述待聚类数据集进行语义识别操作,得到调整语义向量集;对所述调整语义向量集进行聚类操作,得到调整聚类簇集合,并计算所述调整聚类簇集合与所述聚类簇集合之间的聚类数据差异度; 当所述聚类数据差异度不满足预设的聚类数据差异条件时,返回上述对所述语义向量集进行聚类操作,得到聚类簇集合的步骤,直到相邻两次聚类操作后得到的聚类簇集合之间的聚类数据差异度满足所述预设的聚类数据差异条件时,将最后一次的聚类操作得到的聚类簇集合作为所述待聚类数据集的聚类结果; 所述依次计算所述聚类簇集合中每个聚类簇下每个语义向量到对应的聚类中心的距离,包括: 采用MSE距离公式依次计算所述聚类簇集合中每个聚类簇下每个语义向量到对应的聚类中心的距离: 其中,所述为所述聚类簇集合中每个聚类簇下第个语义向量到对应的聚类中心的距离,为调节所述MSE函数贡献度的超参数,为第个语义向量的向量表示,为所述第个语义向量对应的聚类簇的聚类中心的语义向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。