Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 扬州大学王欣获国家专利权

扬州大学王欣获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉扬州大学申请的专利基于自动编码器样本匹配的缺失基因型填充方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117637021B

龙图腾网通过国家知识产权局官网在2025-12-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311691018.6,技术领域涉及:G16B20/30;该发明授权基于自动编码器样本匹配的缺失基因型填充方法是由王欣;蒋震霆;徐扬;徐辰武设计研发完成,并于2023-12-11向国家知识产权局提交的专利申请。

基于自动编码器样本匹配的缺失基因型填充方法在说明书摘要公布了:本发明提供了一种基于自动编码器样本匹配的缺失基因型填充方法,实现了对缺失基因型的低成本精确填充,能够为各种遗传分析工作提供更为准确的基因数据支撑。本发明将目标数据文件中每个位置上样本的基因型信息数值进行转换并最终编码为独热编码,划分训练集和测试集,继而构建卷积去噪自编码器模型。本发明使用自动预处理策略,将参与填充的样本数据集进行分段处理,降低了装置内存占用,使得用户仅使用较低成本的装置就可以顺利进行高精度的基因型填充。本发明填充精度高,模型结构简单可靠,训练效率高,在基因序列分析领域具有广阔的应用前景,可用于后续的生物全基因组关联分析和全基因组选择工作。

本发明授权基于自动编码器样本匹配的缺失基因型填充方法在权利要求书中公布了:1.基于自动编码器样本匹配的缺失基因型填充方法,其特征在于,包括以下步骤: 步骤1,从基因库中选择若干个生物样本的基因组序列数据,预处理所选择的基因组数据,从而获得原始目标基因组序列数据; 步骤2,对步骤1中获得的原始目标基因组序列数据进行进一步处理,得到数值矩阵; 步骤3,对步骤2得到的数值矩阵按照样本,划分训练集和测试集,获得用于模型训练的训练集与用于验证精度、评估实际应用效果的测试集; 步骤4,将测试集样本通过不同占比的散乱数据隐藏;若进行重构操作,需要提供希望重构的位置索引,将会在测试集对应位置索引上的所有训练样本添加基因型隐藏值;测试集样本进行隐藏后转化为模型训练完毕后最终要预测的数据集; 步骤5,根据测试集,使用训练与测试样本自匹配算法,获得与测试集缺失特征相似的缺失索引集合; 步骤6,构造GCDA模型,设置模型超参数,选定初始的数据分段大小、神经元大小; 步骤7,按照步骤6中设置的分段区间对训练集进行分段操作,依次将分段后的数据矩阵通过模型的输入层输入,采用编码器-解码器的卷积自编码器结构,根据步骤5获得的缺失索引遮盖训练集以学习训练集特征,求解输入空间和特征空间两者的映射,使得输入特征的重建误差达到最小,完成对输入信息的特征学习,对基因型数据的连锁关系进行捕获,最后使用学习后的模型对相应区间的测试集数据进行预测,并输出预测结果保存到集合中; 步骤8,对于步骤7得到的输出的数据集合,按照分段顺序将每组预测输出的填充结果数据拼接得到总基因型预测结果数据矩阵;从此基因型矩阵中,提取测试集对应隐藏遮盖的基因型的预测值与实际值,将预测结果与实际数据进行比较,计算填充或重构的精度; 步骤9,重复步骤7、8,根据计算出的精度,优化自编码器模型超参数与分段区间的大小,找出效果最佳的模型参数; 步骤10,将待预测的缺失真实目标基因数据集进行预处理后,输入步骤9完成优化的模型中进行基因型预测,输出基因型数据预测值,完成填充,并输出填充完成后与目标文件格式相同的基因型文件。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人扬州大学,其通讯地址为:225009 江苏省扬州市大学南路88号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。