中国工商银行股份有限公司程永龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国工商银行股份有限公司申请的专利基于分布式分裂融合的初始化kmeans日志分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116595422B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310723425.4,技术领域涉及:G06F18/24;该发明授权基于分布式分裂融合的初始化kmeans日志分类方法是由程永龙;王钰;范淑君;王睿设计研发完成,并于2023-06-16向国家知识产权局提交的专利申请。
本基于分布式分裂融合的初始化kmeans日志分类方法在说明书摘要公布了:本申请提供一种的基于分布式分裂融合的初始化kmeans日志分类方法,涉及大数据领域。该方法包括:获取N个日志样本集合和该日志样本集合对应的副本;确定出每个日志样本集合中的K个中心;并对该日志样本集合的副本中的日志样本进行簇划分,得到该副本的K个簇;获取每个副本中的每个簇的误差函数,根据该簇的误差函数,对该簇进行分裂处理;获取分裂处理后的簇,组成簇集合;根据簇集合中各个簇的簇中心之间的余弦距离,对各个簇进行融合,直到所有的簇的簇中心的距离都满足预设条件;获取该簇集合中的簇中心作为初始质心,进行Kmeans聚类。本方法提高了kmeans聚类算法聚类速度和效果。
本发明授权基于分布式分裂融合的初始化kmeans日志分类方法在权利要求书中公布了:1.一种基于分布式分裂融合的初始化kmeans日志分类方法,其特征在于,包括: 获取N个日志样本集合,对每个日志样本集合进行备份,得到该日志样本集合对应的副本,所述日志样本集合中包括至少一个日志样本,N为正整数; 对每个日志样本集合中的日志样本进行筛选删除,确定出每个日志样本集合中的K个中心,K为正整数; 根据每个日志样本集合中的K个中心,确定该日志样本集合的副本中的K个中心和该副本的K个簇; 获取每个副本中的每个簇的误差函数,根据该簇的误差函数,对该簇进行分裂处理;所述根据该簇的误差函数,对该簇进行分裂处理,包括:计算每个簇中每个日志样本与该簇中心的余弦距离的平方值并求和,得到该簇的误差函数;若该簇的误差函数大于第一预设阈值,则计算该簇中每个日志样本的密度,获取该簇中密度最大日志样本;计算该密度最大日志样本与该簇中该密度最大日志样本之外的其它日志样本的余弦距离,获取距离最远日志样本;根据该簇中其它日志样本与所述密度最大日志样本、距离最远日志样本的余弦距离,将该簇中的其它日志样本分裂为两个不同的簇; 获取分裂处理后的簇,组成簇集合; 根据簇集合中各个簇的簇中心之间的余弦距离,对各个簇进行融合,直到所有的簇的簇中心的距离都满足预设条件; 获取该簇集合中的簇中心,作为初始质心,进行Kmeans聚类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国工商银行股份有限公司,其通讯地址为:100140 北京市西城区复兴门内大街55号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励