Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京工业大学刘博获国家专利权

北京工业大学刘博获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京工业大学申请的专利一种基于改进型Boruta算法的特征选择方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115905831B

龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211432737.1,技术领域涉及:G06F18/2113;该发明授权一种基于改进型Boruta算法的特征选择方法是由刘博;庄须婕;王慧娜设计研发完成,并于2022-11-16向国家知识产权局提交的专利申请。

一种基于改进型Boruta算法的特征选择方法在说明书摘要公布了:本发明提供了一种基于改进型Boruta算法的特征选择方法,步骤为:输入无缺失值的音乐情感识别真实特征集和音乐情感类别标签,初始化最优特征子集、最高分类准确率;生成影子特征集和混合特征集;基于混合特征集构建随机森林分类模型;计算所有特征的重要性得分;标记真实特征是否“重要”;基于分类准确率保存“重要”特征到最优特征子集中;更新真实特征集,重复上述步骤,直到所有的真实特征被标记为“重要”或者“不重要”;最后输出最优特征子集中的特征。本发明针对Boruta算法没有考虑特征的平均减少基尼系数和预测准确率的问题,基于平均减少精度、平均减少基尼系数以及准确率来综合选择特征,实验证明,本方法有更好的降维效果,更高的分类准确率。

本发明授权一种基于改进型Boruta算法的特征选择方法在权利要求书中公布了:1.一种基于改进型Boruta算法的特征选择方法,其特征在于,步骤如下: 步骤1:对于原始音乐情感识别数据集进行处理,删除缺失值,得到用于特征选择的音乐情感识别真实特征集和音乐情感类别标签; 步骤2:将步骤1的音乐情感识别真实特征集中的特征作为一种基于改进型Boruta算法的特征选择方法的输入,输出结果为选择出的重要特征; 所述的步骤2中一种基于改进型Boruta算法的特征选择方法,步骤如下: 步骤2-1:指定步骤1得到的音乐情感识别真实特征集为X,设X有n列真实特征,音乐情感类别标签为y,初始化最优特征子集B为空集,最高分类准确率MaxAcc为0; 步骤2-2:生成影子特征集和混合特征集,将音乐情感识别真实特征集X复制一份生成X′特征集,将X′中每一列特征数据进行随机行变换,生成影子特征集S,影子特征集S同样是有n列特征的特征集;最后将X与S进行合并得到包含2*n列特征的混合特征集M; 步骤2-3:使用混合特征集M以及类别标签y构建随机森林分类器,随机森林分类器中的基分类器个数使用默认数值500,每个决策树包含的变量个数使用默认值logN,N为输入特征个数,即N=2*n;随机森林分类器训练后输出每个特征的平均减少精度MeanDecreaseAccuracyMDA和平均减少基尼系数MeanDecreaseGiniMDG; 步骤2-4:基于步骤2-3得到的MDA和MDG计算每个特征的重要性得分ImportanceScoreIS,计算公式为: 其中,MDAmax表示2*n个混合特征的平均减少精度MDA的最大值,MDAmin表示2*n个混合特征的平均减少精度mDA的最小值,MDGmax表示2*n个混合特征的平均减少基尼系数MDG的最大值,MDGmin表示2*n个混合特征的平均减少基尼系数MDG的最小值; 步骤2-5:设{RISi|1≤i≤n}是由步骤2-4计算得到的n个真实特征的IS结果,真实特征是否重要的决策标准为: 公式3中,MaxSIS是n个影子特征的IS的最大值,MeanSIS是n个影子特征的IS的平均值; 步骤2-6:基于分类准确率更新最优特征子集,选取Label=“重要”的真实特征作为当前重要特征集T,将T中的样本随机分为10份,每份均做1次测试集,其余的9份作为训练集,交叉验证重复10次;每次交叉验证使用随机森林分类器进行模型训练,随机森林分类器个数使用默认数值500,每个决策树包含的变量个数使用默认值logN,N为输入特征个数;每次交叉验证测试集分类准确率计算公式为: 其中,j表示交叉验证次数,TP表示测试集中实际为正预测为正的样本个数,TN表示测试集中实际为负预测为负的样本个数,FP表示测试集中实际为负但预测为正的样本个数,FN表示测试集中实际为正但预测为负的样本个数; 最后对10次验证集的分类准确率取均值作为当前分类准确率;如果当前分类准确率大于最大分类准确率MaxAcc,则将“重要”的真实特征保存到最优特征子集中;否则,不保存; 步骤2-7:更新真实特征集X,从真实特征集X中删除Label=“不重要”的真实特征,重复步骤2-2至2-7,直到所有的特征都被标记为重要或者不重要; 步骤2-8:循环结束之后,输出最优特征子集,输出最优特征子集B中的特征即为特征筛选结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。