Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 武汉大学桂志鹏获国家专利权

武汉大学桂志鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉武汉大学申请的专利一种基于局部方向中心性的数据分布式聚类方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115658809B

龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211265216.1,技术领域涉及:G06F16/27;该发明授权一种基于局部方向中心性的数据分布式聚类方法及装置是由桂志鹏;黄子晨;彭德华设计研发完成,并于2022-10-17向国家知识产权局提交的专利申请。

一种基于局部方向中心性的数据分布式聚类方法及装置在说明书摘要公布了:本发明公开了一种基于局部方向中心性的数据分布式聚类方法及装置,其中的方法包括以下步骤:S1、在分布式集群环境中提交算法任务所需参数,读取待聚类数据;S2、基于完整数据构建优先搜索K‑means树全局索引,并共享索引变量至集群各工作节点;S3、结合数据采样和Hilbert曲线分区方法对完整数据进行划分;S4、在各工作节点上并行执行CDC局部聚类;S5、根据局部类簇的最大可达距离进行分区间类簇合并,生成完整的类簇;S6、将聚类结果输出到分布式文件系统中。本发明方法从算法流程优化与并行处理优化两个角度对CDC聚类算法进行分布式优化与加速,旨在提高CDC算法的计算效率,为该算法在海量数据挖掘、机器学习任务中的应用提供一种可行的优化方案。

本发明授权一种基于局部方向中心性的数据分布式聚类方法及装置在权利要求书中公布了:1.一种基于局部方向中心性的数据分布式聚类方法,其特征在于,包括: S1:接收聚类任务所需的参数,包括环境参数、聚类算法参数、分区参数、近邻搜索参数,配置并注册序列化器,从分布式文件系统中读取待聚类的完整数据; S2:基于读取的待聚类的完整数据构建优先搜索K-means树全局索引,通过分布式集群的主节点将全局索引共享给各工作节点; S3:结合数据采样和Hilbert曲线分区方法对待聚类的完整数据进行分区,并得到对应的分区ID,通过分布式集群的主节点将分区ID对应的分区数据发送至对应的工作节点; S4:分布式集群的各个工作节点并行执行CDC局部聚类算法,具体包括:工作节点通过共享的全局索引分别对分区数据进行k最近邻搜索并计算DCM值,并根据DCM值与DCM阈值之间的关系划分内部点和边界点,再基于内部点到边界点的可达距离进行内部点的合并,合并后的内部点归为同一个内部点类簇,标记内部点类簇ID,搜索与边界点最邻近的内部点并标记边界点类簇ID,得到局部类簇,其中,DCM值为数据点与其k个邻近点在二维空间形成的角度方差; S5:分布式集群的主节点根据局部类簇的最大可达距离进行分区间局部类簇的合并,生成完整的类簇,作为聚类结果; S6:将聚类结果输出到分布式文件系统中; 其中,步骤S5包括: 对局部类簇中每个内部点的可达距离进行排序,得到最大可达距离; 根据最大可达距离以及两个类簇之间的距离不大于两簇可达距离之和的连接规则进行分区间类簇合并,即,并更新类簇ID,生成完整的类簇,其中,为两个不同的局部类簇,分别为局部类簇的最大可达距离,为中取得最大可达距离的内部点之间的距离。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区珞珈山街道八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。