数据空间研究院马韵洁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉数据空间研究院申请的专利一种基于多组学数据聚类重标记的癌症类别检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119673295B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411748524.9,技术领域涉及:G16B40/30;该发明授权一种基于多组学数据聚类重标记的癌症类别检测方法是由马韵洁;夏莎莎;吴艳平;谢路昱;王飞设计研发完成,并于2024-12-02向国家知识产权局提交的专利申请。
本一种基于多组学数据聚类重标记的癌症类别检测方法在说明书摘要公布了:本发明公开了一种基于多组学数据聚类重标记的癌症类别检测方法,涉及机器学习技术领域。类别检测模型的学习过程为:获取n个多组学数据样本,每个样本包含m个不同类别的组学数据,样本标签为样本所对应的癌症类别,共有K个癌症类别;对样本进行预处理,并利用模型对预处理后的样本生成样本特征;根据样本特征,对预处理后的样本进行聚类,聚类为K个簇;对每个簇进行杂质度量,并对簇内的样本标签进行重标记;基于重标记结果,进行对比学习,使模型生成准确样本特征;根据模型所生成的准确样本特征,预测癌症类别。本发明利用类别检测模型进行癌症类别检测,通过样本标签的重建以及对比学习方法的应用,有利于提高癌症分型的准确性。
本发明授权一种基于多组学数据聚类重标记的癌症类别检测方法在权利要求书中公布了:1.一种基于多组学数据聚类重标记的癌症类别检测方法,其特征在于,利用类别检测模型进行癌症类别检测,类别检测模型的学习过程,包括以下步骤: S1,获取n个多组学数据样本,每个样本包含m个不同类别的组学数据,样本标签为样本所对应的癌症类别,共有K个癌症类别;对样本进行预处理,并利用模型对预处理后的样本生成样本特征; S2,根据样本特征,对预处理后的样本进行聚类,聚类为K个簇; S3,对每个簇进行杂质度量,并对簇内的样本标签进行重标记; S4,基于重标记结果,进行对比学习,使模型生成准确样本特征; S5,根据模型所生成的准确样本特征,预测癌症类别; 步骤S3的具体过程如下所示: 簇c的簇标签Rc为: 其中,表示簇c中样本标签为y的样本概率;y表示样本标签;Yc表示簇c中所有样本的样本标签集合,argmax函数表示求取为最大值时所对应的样本标签y; 簇c的杂质水平Impc为: 其中,C表示簇的总数量; 分别设置杂质下限θlow和杂质上限θhigh: 若Impcθlow,则将簇c中样本标签与簇标签Rc不同的样本认为是初始标记错误的样本,对初始标记错误的样本进行重标记,样本标签重新标记为Rc; 若θlowImpcθhigh,则对簇c中样本标签与簇标签Rc不同的样本认为是噪声样本,对噪声样本进行重标记,样本标签重新标记为噪声样本标签; 若Impcθhigh,则对簇c中的所有样本进行重标记,样本标签重新标记为一个新的未知样本标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人数据空间研究院,其通讯地址为:230000 安徽省合肥市高新区柏堰科技园创新大道288号工投高新智谷B区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。