广东工业大学张逸群获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东工业大学申请的专利一种基于多簇判别器的无监督概念漂移检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117195011B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310977090.9,技术领域涉及:G06F18/23;该发明授权一种基于多簇判别器的无监督概念漂移检测方法是由张逸群;赵明杰;姬玉柱设计研发完成,并于2023-08-03向国家知识产权局提交的专利申请。
本一种基于多簇判别器的无监督概念漂移检测方法在说明书摘要公布了:本发明公开了一种基于多簇判别器的无监督概念漂移检测方法,如下:将不同时间段流入的数据组织成不同的数据块;将第一个流入的数据块作为基分布数据块,使用不平衡聚类方法对基分布数据块进行划分学习,根据基分布数据块的数据分布信息,将每个簇以区分,从而独立出大簇与小簇;训练多簇判别器,利用划分学习后的簇结构训练多个单分类器,利用多个训练好的单分类器组成多簇判别器;通过多簇判别器监控后续流入的测试数据块中各个簇的新分布样本占比情况,当新分布样本占比大于设定的漂移阈值时,报告漂移发生。本发明的方法不论是小簇还是大簇的漂移,都能很好的检测,并且还具有了定位漂移簇的位置的能力,这可以让本发明更好的理解漂移。
本发明授权一种基于多簇判别器的无监督概念漂移检测方法在权利要求书中公布了:1.一种基于多簇判别器的无监督概念漂移检测方法,其特征在于:所述的方法包括步骤如下: S1:数据块收集,将不同时间段流入的数据组织成不同的数据块; S2:数据分布学习,将第一个流入的数据块作为基分布数据块,使用不平衡聚类方法对基分布数据块进行划分学习,根据基分布数据块的数据分布信息,将每个簇以区分,从而独立出大簇与小簇; S3:训练多簇判别器,利用划分学习后的簇结构训练多个单分类器,利用多个训练好的单分类器组成多簇判别器; S4:漂移检测,通过多簇判别器监控后续流入的测试数据块中各个簇的新分布样本占比情况,当新分布样本占比大于设定的漂移阈值时,报告漂移发生; 步骤S2中,所述使用不平衡聚类方法对基分布数据块进行划分学习,根据基分布数据块的数据分布信息,将每个簇以区分,从而独立出大簇与小簇,具体如下: 先定义初始的种子点S,然后让种子点之间相互竞争,确定胜利者;通过惩罚失败者、奖励胜利者的方式,使得种子点来到簇的中心位置,且驱赶走其他簇的种子点; 使用竞争惩罚系数beta来区分簇内子簇和簇间子簇的竞争惩罚,根据胜利者的位置、竞争对手的位置和簇中点的位置更新胜利的种子点; 当有种子点被惩罚到远离所有集群,既被驱逐时,结束划分学习,此时每个集群都由多个子簇表示; 对部分子簇进行融合,并使用一个聚类内部评价指标得出最佳的簇的数量,及对应的子簇融合队列,由此得到对Db的划分学习结果M; 若竞争收敛后,没有种子点被赶走,即当前多数簇和少数簇还没有分别被一系列子簇代表,在获胜次数bj最多且密度间隙σj最大的簇中增加竞争种子点; 重复竞争过程,直到有种子点被惩罚到远离所有集群,既被驱逐时,结束划分学习; 所述对部分子簇进行融合,具体使用混合一维二元高斯分布来对子簇之间的分离度hij进行度量,分离度越低表示两个子簇越应该被融合; 步骤S3中,所述多簇判别器包括多个单分类器;其中单分类器由划分结果得来的不同簇训练而成,具体地,将划分结果中的第i个簇Mi中所有样本点作为正样本对第i个单分类器cix进行训练,然后根据minfw得到完成训练的第i个单分类器cix,其中fw是一个代价函数,用于衡量模型对于正例的拟合程度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510080 广东省广州市越秀区东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励