中国科学院生态环境研究中心宋杨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院生态环境研究中心申请的专利基于多元机器学习模型的跨物种肺部疾病特征基因筛选方法、系统、电子系统及存储装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121072811B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511609481.0,技术领域涉及:G06N20/20;该发明授权基于多元机器学习模型的跨物种肺部疾病特征基因筛选方法、系统、电子系统及存储装置是由宋杨;曹建中;王馨语;孙天磊;宋尔群设计研发完成,并于2025-11-05向国家知识产权局提交的专利申请。
本基于多元机器学习模型的跨物种肺部疾病特征基因筛选方法、系统、电子系统及存储装置在说明书摘要公布了:本发明提供一种基于多元机器学习模型的跨物种肺部疾病特征基因筛选方法、系统、电子系统及存储装置,该方法包括:从公共数据库获取人类与小鼠肺部疾病相关的单细胞转录组数据并进行预处理;采用六种机器学习算法训练模型并输出基因重要性得分;依据模型性能计算权重并对得分进行归一化;通过加权融合公式整合跨物种得分,输出特征基因列表及可视化报告。系统包括数据获取与预处理模块、多元机器学习模型训练模块、权重计算与归一化模块、跨物种综合评分模块及结果输出模块。本发明通过多算法集成与跨物种融合提升筛选准确性、稳定性及泛化能力,可广泛应用于肺部疾病的机制研究、诊断标志物开发及药物靶点验证领域。
本发明授权基于多元机器学习模型的跨物种肺部疾病特征基因筛选方法、系统、电子系统及存储装置在权利要求书中公布了:1.一种基于多元机器学习模型的跨物种肺部疾病特征基因筛选方法,其特征在于,包括以下步骤: S1:数据获取与预处理——从公共数据库批量获取人类与小鼠肺部疾病的单细胞或转录组数据,进行质量控制、归一化、聚类及细胞类型注释,生成标准化基因表达矩阵; S2:多元机器学习模型训练——分别采用LASSO、随机森林、决策树、支持向量机、梯度提升机和XGBoost六种算法训练模型,输出各算法的基因重要性得分; S3:权重计算与归一化——基于人源与鼠源数据集的模型性能计算权重,对各算法得分进行Min-Max归一化处理; 所述S3中: S31:模型性能评估指标计算 对六种机器学习算法在人源数据集和鼠源数据集上分别计算两项性能指标: a绝对反向残差:通过计算模型预测概率与真实标签独热编码的差值绝对值获得,反映模型预测准确性; bROC曲线下面积AUC:通过受试者工作特征曲线下面积计算,其中: a1二分类问题直接计算ROC曲线下面积AUC; b1多分类问题采用宏平均策略计算整体ROC曲线下面积AUC; S32:权重分配策略设计 基于S31的性能指标设计权重分配方案: AROC曲线下面积AUC权重分配:按比例分配,ROC曲线下面积AUC值越高的算法获得越大权重; B残差权重分配:采用逆向分配,平均绝对残差越小的算法获得越大权重; C综合权重计算:通过ROC曲线下面积AUC权重和残差权重的算术平均值确定最终权重; S33:Min-Max归一化实现 对各算法输出的基因重要性得分进行标准化处理: 归一化公式为: 其中, :算法j的基因i的得分; :归一化后算法j的基因i的得分; :算法j中的最小得分; :算法j中的最大得分; 将得分范围统一标准化至[0,1]区间,消除算法间量纲差异; S34:跨物种权重一致性验证 分别计算人源与鼠源数据集上各算法的权重; 通过相关性分析验证跨物种权重分配的一致性; 建立权重校正机制:当某算法在两种物种间性能差异超过阈值时,采用保守策略调整权重,避免单一物种数据偏差影响结果; S4:跨物种综合评分与输出——通过加权融合公式整合人源和鼠源得分,获得目标基因的综合评分并输出特征基因列表; 所述S4中跨物种综合评分公式为: 其中, :算法j中在小鼠数据集上的性能权重; :算法j中在人类数据集上的性能权重; :基因i在小鼠数据集中被选中的算法数量; :基因i在人类数据集中被选中的算法数量; :归一化后算法j的基因i的得分; :跨物种基因i的综合评分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院生态环境研究中心,其通讯地址为:100085 北京市海淀区双清路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励