安徽大学夏俊峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学申请的专利基于多源迁移学习的致病同义突变预测方法、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120126572B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510212623.3,技术领域涉及:G16B40/00;该发明授权基于多源迁移学习的致病同义突变预测方法、设备及介质是由夏俊峰;陈勇;李晓艳设计研发完成,并于2025-02-25向国家知识产权局提交的专利申请。
本基于多源迁移学习的致病同义突变预测方法、设备及介质在说明书摘要公布了:本发明的一种基于多源迁移学习的致病同义突变预测方法、设备及介质,包括从数据库和已发表文献中获取原始数据;构建目标域数据集以及多源域数据集;多源迁移学习模型构建,将目标域数据集和多源域数据集划分为训练集和验证集,多源域训练集用于预训练多源域迁移学习模型,而验证集则用于模型参数的优化,最终得到性能最佳的模型;使用构建好的模型对外来测试集进行预测,获取其为致病同义突变的概率。本发明针对小样本数据,采用多源迁移学习的方式,借助域分类器对抗学习算法和在线硬域批量挖掘算法构建最优的模型,实现对致病同义突变的预测与分类,综合性能在现有的方法中为最优,为后续致病同义突变的发现和精准医疗的发展做出了重要贡献。
本发明授权基于多源迁移学习的致病同义突变预测方法、设备及介质在权利要求书中公布了:1.一种基于多源迁移学习的致病同义突变预测方法,其特征在于,包括以下步骤, 数据获取,从数据库和已发表文献中获取原始数据; 数据集构建,处理原始数据,构建目标域数据集以及多源域数据集; 多源迁移学习模型构建,模型包括数据预处理、特征提取、域分类器和目标分类四个功能模块; 模型训练,将目标域数据集和多源域数据集划分为训练集和验证集,多源域训练集用于预训练多源域迁移学习模型,将卷积模块参数加权继承后,使用目标域训练集再训练模型,而验证集则用于模型参数的优化,最终得到性能最佳的模型; 模型预测,使用构建好的模型对外来测试集进行预测,获取其为致病同义突变的概率; 多源迁移学习模型构建包括以下步骤, 1数据预处理:将目标域和多源域数据集中核苷酸序列数据转换为可以输入到深度学习网络中的数字化数据,以突变位点为中心,上下游各延伸500bp,得到的序列进一步编码为独热编码A:[1,0,0,0],C:[0,1,0,0],G:[0,0,1,0],T:[0,0,0,1]; 2特征提取:将具有特征提取功能的卷积神经网络CNN以及高效通道注意力网络ECA作为特征提取器,实现对目标域和多源域数据的特征提取;先使用卷积神经网络CNN对数据进行卷积操作,再将卷积后的数据输入到通道注意力网络并得到输出,最终分别得到目标域和多源域特征; 3域分类器:卷积模块提取的特征输入域分类器,通过对抗学习机制进行训练,旨在最大化其区分能力,同时生成困惑度分数,这些分数表示目标样本属于不同源域的可能性,利用这些困惑度分数在后续的目标分类过程中为多源类别预测提供权重,从而有效整合来自不同源域的信息,提升模型在目标域上的适应能力; 4目标分类:将多源类别分类器的预测结果与域分类器得到的困惑度分数结合,用于对目标样本进行分类; 域分类器对抗学习算法流程为: 1输入N个源域标记数据集,目标域未标记数据集,初始化特征提取器F,类别分类器C和域鉴别器D,置信度阈值,对抗迭代阈值; 2使用所有源域的标记数据来预训练特征提取器F和类别分类器C,当模型尚未收敛时,执行以下步骤:对于1:次迭代,从每个源域和目标域中采样小批量数据,使用以下公式更新域鉴别器D,再顺序地使用在线硬域批量挖掘算法更新特征提取器F: 3使用以下公式提供的困惑度分数,估计的置信度: 4选择置信度大于的的样本,并为这些样本分配伪标签,并使用以下公式更新特征提取器F和类别分类器C: 返回训练好的模型参数F*=F,C*=C,D*=D; 在线硬域批量挖掘算法流程为: 1输入从目标域和各个源域,中分别采样得到的小批量数据,特征提取器F,域鉴别器D及类别分类器; 2选择一个源域j*[N],,其中是域鉴别器D对源域j的样本的判别结果; 3计算对抗损失: 4用替换,更新特征提取器F: 。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经开区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励