之江实验室徐圣源获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉之江实验室申请的专利一种基于贪心算法的机器学习分类模型解释方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116050539B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211687370.8,技术领域涉及:G06N20/00;该发明授权一种基于贪心算法的机器学习分类模型解释方法是由徐圣源;周婷婷;焦旭;梁变;胡汉一;刘智;许浩设计研发完成,并于2022-12-27向国家知识产权局提交的专利申请。
本一种基于贪心算法的机器学习分类模型解释方法在说明书摘要公布了:一种基于贪心算法的机器学习分类模型解释方法,该方法使用贪心算法组合特征箱体,分别以每个筛选后箱体为起点,获得特征箱体组合。将特征匹配学习的特征箱体组合,可以对目标的特征统计情况有更加全面的了解并以此对机器学习结果做出解释。本方法运用贪心策略,对特征进行了筛选与组合,为企业提供了一种更加直观的客户筛选方法,在实际应用中主要用于辅助解释黑匣模型预测结果,服务一线业务人员。
本发明授权一种基于贪心算法的机器学习分类模型解释方法在权利要求书中公布了:1.一种基于贪心算法的机器学习分类模型解释方法,其特则在于: 步骤一:获取训练集中的客户历史特征数据、行为数据、分类标签; 步骤二:对所述的客户历史特征数据和行为数据进行清洗,然后保留相关性达到阈值的特征中信息价值最高的特征; 步骤三:对经步骤二处理后的特征进行分箱处理,形成最终输入机器学习模型的特征表; 步骤四:利用所述特征表和分类标签训练输入为结构化数据的机器学习分类模型,得到机器学习分类模型的特征重要性排序; 步骤五:计算每个箱体的信息价值和箱体的目标客户数量,结合所述特征重要性排序,构建每个箱体的箱体指标;保留箱体指标大于箱体筛选阈值的箱体,作为特征箱体; 步骤六:以每个特征箱体为起点,通过贪心算法找到一系列针对目标客户的特征箱体组合,作为特征箱体组合字典; 步骤七:将新的客户特征数据、行为数据经过步骤二的预处理和步骤三的分箱处理后,输入训练后的机器学习分类模型,得到新的客户的预测标签;若根据新客户的预测标签判断该客户为目标客户,则该新客户的特征匹配所述特征箱体组合字典,输出命中的特征箱体组合,作为机器学习分类模型的说明; 所述步骤三中,类别型特征一类为一个箱体,日期型特征按年份或月份进行分箱,数值型特征采用最小条件熵分箱方法进行分箱处理; 其中,采用最小条件熵分箱方法进行分箱处理具体包括: 1依次将特征的每个取值作为划分点,将特征一分为二,计算该特征的两个箱体的条件熵加权和: 其中,HY表示该特征条件熵值加权和,表示箱体数量占比,pj为单个箱体xi中客户占比或非客户占比; 2选择条件熵加权和最小的值作为划分点,将一个箱体划分为两个箱体; 3选择该特征中条件熵最大的箱体,重复步骤1~2,继续对该箱体进行划分,直至该特征的分箱数量达到设定的单个特征的分箱个数上限。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室,其通讯地址为:311121 浙江省杭州市余杭区之江实验室南湖总部;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励