浙江工业大学陈晋音获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利一种基于局部搜索的去偏方法、电子设备、介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115795327B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211524805.7,技术领域涉及:G06F18/23;该发明授权一种基于局部搜索的去偏方法、电子设备、介质是由陈晋音;陈一鸣设计研发完成,并于2022-11-30向国家知识产权局提交的专利申请。
本一种基于局部搜索的去偏方法、电子设备、介质在说明书摘要公布了:本发明公开了一种基于局部搜索的去偏方法、电子设备、介质,所述方法包括:获取原始数据,并对所述原始数据中的类别属性进行标记,得到标记后的数据集,记作数据集X;在步骤1选取的数据集X中进行基于局部搜索的聚类分析,使用P表示聚类的点集,对于大小为n的点集P中的点x,令rx为半径,使得以x为中心的半径为rx的球内至少具有来自P的nk个点。本发明方法使得数据集中的不同簇群的样本点尽可能相异,即类内距离尽可能小,类间距离尽可能大。每个簇群的敏感属性的分布要尽可能均匀,提高数据集的公平性。
本发明授权一种基于局部搜索的去偏方法、电子设备、介质在权利要求书中公布了:1.一种基于局部搜索的去偏方法,其特征在于,所述方法包括以下步骤: 1获取原始数据,并对所述原始数据中的类别属性进行标记,得到标记后的数据集,记作数据集;所述原始数据为带有敏感属性的文本数据集; 2在步骤1选取的数据集X中进行基于局部搜索的聚类分析,使用P表示聚类的点集,对于大小为的点集中的点,令为半径,使得以为中心的半径为的球内至少具有来自的个点;使得数据集X中的不同簇群的样本点尽可能相异,即类内距离尽可能小,类间距离尽可能大;每个簇群的敏感属性的分布要尽可能均匀,以提高数据集X的公平性,完成基于局部搜索的去偏; 所述步骤2具体包括以下子步骤: 2.1在步骤1选取的数据集X中找到一组关于临界球的个可行的中心:使用P表示聚类的点集,参数表示允许聚类的中心数;对于每个,将表示为一个半径为,围绕的球中包含的点集;将每个聚类中心数所对应的最小半径记为一个,也即,遍历每一个,将样本划入相应的中心簇:,寻找中大于的点,其中,为高斯混合系数; 2.2构造初始中心集:令,选取在点集中但是不在初始中心集中的点,并且将这些点里面到中心距离最大的点记为集合,即,再将初始中心集与集合z求并集,更新得到可行中心集,也即 2.3对步骤2.2得到的可行中心集依据聚类成本进行筛选;所述步骤2.3具体为: 对步骤2.2得到的可行中心集进行本地搜索更新:将当前中心中的个中心替换为之外的个中心集,结果记录在一组关于临界球B的可行中心集中;如果存在这样的可行中心集合,使得其聚类成本小于以为中心的聚类成本的1-ε倍,即;那么令并继续下一次迭代;如果不存在,那么就停止该迭代并输出当前的中心集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励