四川大学卢莉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利围术期患者样本数据集均衡方法及样本数据集获取系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115206538B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210760514.1,技术领域涉及:G16H50/70;该发明授权围术期患者样本数据集均衡方法及样本数据集获取系统是由卢莉;王琳娜;朱涛;郝学超;桑永胜设计研发完成,并于2022-06-30向国家知识产权局提交的专利申请。
本围术期患者样本数据集均衡方法及样本数据集获取系统在说明书摘要公布了:本发明提供了一种围术期患者样本数据集均衡方法及样本数据集获取系统。样本数据集均衡方法包括:S1,对围术期患者的样本数据集中的少数类标签样本进行过采样获得合成样本,为合成样本生成对应的合成标签集,样本数据集包括多个样本和样本对应分类标签集;S2,将合成样本和合成标签集加入样本数据集获得临时样本数据集;S3,对临时样本数据集中的样本进行清洗获得均衡样本数据集。对样本数据集中的少数类标签样本进行过采样以增加少数类标签样本数量,均衡多数类标签样本和少数类标签样本,清洗噪声样本提升输出的均衡样本数据集中样本质量,均衡样本数据集用于后续分类处理时能够提升分类模型的表现效果。
本发明授权围术期患者样本数据集均衡方法及样本数据集获取系统在权利要求书中公布了:1.一种围术期患者样本数据集均衡方法,其特征在于,包括: 步骤S1,采用MLSMOTE算法对围术期患者的样本数据集中的少数类标签样本进行过采样获得合成样本,为合成样本生成对应的合成标签集,所述样本数据集包括多个样本以及样本对应的分类标签集; 步骤S2,将合成样本和合成标签集加入样本数据集获得临时样本数据集; 步骤S3,对临时样本数据集中的样本进行清洗获得均衡样本数据集,所述步骤S3为对临时样本数据集中每个样本进行清洗处理,所述清洗处理过程包括: 步骤S31,从临时样本数据集中选取种子样本,选择种子样本的k个近邻样本,k个近邻样本的分类标签组成近邻分类标签集,k为正整数; 步骤S32,基于近邻分类标签集通过贝叶斯条件概率预测种子样本的分类标签集,获得种子样本的预测分类标签集; 步骤S33,判断种子样本的预测分类标签集与其在临时样本数据集中的分类标签集是否相同,若相同,保留该种子样本,若不相同,删除该种子样本; 在所述步骤S31中,选择种子样本的k个近邻样本的具体过程包括: 获取种子样本分别与临时样本数据集中全部或部分样本的异类值差度量HVDM; 利用临时样本数据集中样本的全局不平衡权重对异类值差度量HVDM进行修正获得修正异类值差度量; 对临时样本数据集中所有样本与种子样本的修正异类值差度量进行排序,选取前k个修正异类值差度量大的样本作为种子样本的k个近邻样本; 其中,种子样本与临时样本数据集中样本的修正异类值差度量的计算公式为: DWf1,f2=e1-IWn·HVDMf1,f2; 其中,f1表示种子样本的特征向量;f2表示临时样本数据集中除种子样本之外的任一样本的特征向量;HVDMf1,f2表示特征向量f1与f2的异类值差度量;DWf1,f2表示特征向量f1与f2的修正异类值差度量;n表示临时样本数据集中样本的特征维数;IW表示特征向量为f2的样本的全局不平衡权重,IW=IRnnIR++IR-,IR+表示临时样本数据集中所有少数类分类标签总不平衡率,IR-表示临时样本数据集中所有多数类分类标签总不平衡率,IRnn为特征向量为f2的样本的分类标签集中所有分类标签的总不平衡率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610000 四川省成都市一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励