四川大学张霁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利一种基于机器学习算法的DNA数据库检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119517181B 。
龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411499345.6,技术领域涉及:G16B50/30;该发明授权一种基于机器学习算法的DNA数据库检索方法是由张霁;胡渝涵;朱强;王玉芳;侯婷芸;王雨婷设计研发完成,并于2024-10-25向国家知识产权局提交的专利申请。
本一种基于机器学习算法的DNA数据库检索方法在说明书摘要公布了:本发明涉及数据库信息分析技术领域,具体涉及一种基于机器学习算法的DNA数据库检索方法;收集图谱数据集信息,计算LR参数θ;分别模拟每个已知贡献者的具有亲子关系的个体、有全同胞关系的个体、无关个体;将每个混合DNA图谱与每个候选个体的分型对比,获取特征值;获得特征与标签的训练数据集与测试数据集;利用训练数据集对回归模型进行训练,并在训练过程中进行超参优化与特征选择;将测试数据集作为所有训练好的模型的输入,获得所有模型的预测值;获得来自现场的混合DNA图谱,依次遍历DNA数据库中每一个候选个体计算每个候选个体对应的特征值,并进行LR预测,得到目标个体;通过上述方式,满足高效、精准筛选需求。
本发明授权一种基于机器学习算法的DNA数据库检索方法在权利要求书中公布了:1.一种基于机器学习算法的DNA数据库检索方法,其特征在于,包括如下步骤: 收集大规模STR-DNA图谱数据集信息;其中所述数据集包括单一来源图谱和混合DNA图谱,每个图谱包括等位基因数据、峰高数据,所述混合DNA图谱由至少两名贡献者的DNA共同构成; 采用数据集中单一来源图谱,计算LR先验参数θ; 针对数据集中的每个混合DNA图谱,分别模拟每个已知贡献者的具有亲子关系的个体、有全同胞关系的个体、无关个体; 针对数据集中的每个混合DNA图谱,混合DNA图谱由K个已知贡献者组成,遍历每个候选个体,设置互斥假设命题Hp、Hd;计算两个假设下的概率比值LR,将Log10LR作为标签值;其中Hp为混合DNA图谱由候选个体和K-1个未知无关个体组成;Hd为混合DNA图谱由K个未知无关个体组成; 将每个混合DNA图谱与每个候选个体的分型对比,获取特征值,并对特征值进行归一化处理; 获得特征与标签的数据集,将该数据集划分为训练数据集与测试数据集; 使用回归模型,利用训练数据集对回归模型进行训练,并在训练过程中进行超参优化与特征选择; 将测试数据集作为所有训练好的模型的输入,获得所有模型的预测值,并判断目标模型; 获得来自现场的混合DNA图谱,依次遍历DNA数据库中每一个候选个体计算每个候选个体对应的特征值,并进行Log10LR预测,得到目标个体。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610044 四川省成都市一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。