Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安电子科技大学高琳获国家专利权

西安电子科技大学高琳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安电子科技大学申请的专利一种精准的单细胞多组学匹配数据生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115862746B

龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211449668.5,技术领域涉及:G16B40/00;该发明授权一种精准的单细胞多组学匹配数据生成方法是由高琳;兰猛;张世雄;崔议文设计研发完成,并于2022-11-18向国家知识产权局提交的专利申请。

一种精准的单细胞多组学匹配数据生成方法在说明书摘要公布了:本发明公开了一种精准的单细胞多组学匹配数据生成方法,主要解决当前多组学测序技术的高成本、高噪声导致多组学匹配数据获取较难的问题。其方案为:对单细胞中同时测量得到的转录组数据和染色质可及性数据进行预处理;构建转录组生成染色质可及性模型和染色质可及性生成转录组模型;对这两种模型均进行预训练和精细训练得到训练好的模型;对于只有单细胞转录组数据通过训练好的转录组生成染色质可及性模型得到细胞多组学匹配数据,对于只有染色质可及性数据通过训练好的染色质可及性生成转录组模型得到细胞多组学匹配数据。本发明成本低,生成单细胞多组学匹配数据准确率高,可用于为探究生物发育及疾病治疗提供参考数据。

本发明授权一种精准的单细胞多组学匹配数据生成方法在权利要求书中公布了:1.一种精准的单细胞多组学匹配数据生成方法,其特征在于,包括如下: 1使用单细胞多组学测序法对所需组织中的单细胞同时测量其基因表达值和染色质可及性值,产生包括单细胞转录组和染色质可及性的单细胞多组学匹配数据; 2对单细胞转录组scRNA-seq数据进行预处理: 2a删除单细胞转录组scRNA-seq数据性染色体上的基因,并删除基因表达少于200个或超过7000个的低质量细胞; 2b对删除后的数据进行数值归一化,使得各个细胞的计数和为所有细胞的中位数,再对归一化后的数据进行对数转换,并将其标准化为零均值和单位方差; 2c对标准化后的数据裁剪其数据分布中顶部和底部0.5%的值; 3对单细胞染色质可及性scATAC-seq数据进行预处理: 3a过滤掉单细胞染色质可及性scATAC-seq数据少于5个细胞或者超过10%细胞中出现的峰值; 3b对于过滤后的数据,根据其类型确定是否进行坐标转换: 如果是Hg38的数据,则无需操作; 如果是Hg19的数据,则将Hg19坐标转换为Hg38坐标; 4使用Leiden算法对转录组数据进行聚类,并将其中最大的两个簇划分为验证集和测试集,剩余的簇组成了训练集; 5构建转录组RNA生成染色质可及性ATAC模型: 5a建立由输入层维度为转录组基因数、第一隐藏层为256维、第二隐藏层为64维、第三隐藏层为16维级联组成的RNA编码器,所有层均使用LeakyRelu函数作为激活函数; 5b建立由输入维度为16维、第1隐藏层为64维、第2隐藏层为512维、输出层为染色质可及性数据特征维级联组成的ATAC解码器,且除最后一层外其余层使用LeakyRelu函数作为激活函数,并设该解码器的最后一层的激活函数为sigmoid函数; 5c建立由输入维度为染色质可及性数据特征维度、第一隐藏层为1024维、第二隐藏层为256维、第三隐藏层为64维、第四隐藏层为16维、输出层为1维级联组成的ATAC鉴别器,且除最后一层的1维不设置激活函数外,其余各层使用LeakyRelu函数作为激活函数; 5d将RNA编码器,ATAC解码器,ATAC鉴别器级联组成转录组RNA生成染色质可及性ATAC模型,并采用Wasserstein距离作为损失函数; 6将步骤2预处理后的RNA数据和步骤3预处理后的ATAC数据输入转录组RNA生成染色质可及性ATAC模型,通过WGAN的方法完成模型的预训练,再去除ATAC鉴别器,并引入FocalLoss作为损失函数对预训练后的网络参数进行更新,得到训练好的转录组RNA生成染色质可及性ATAC模型; 7构建染色质可及性ATAC生成转录组RNA模型: 7a建立由输入层维度为染色质可及性数据特征维度、第一隐藏层为512维、第二隐藏层为64维、第三隐藏层为16维潜在表征级联组成的ATAC编码器,所有层均使用LeakyRelu函数作为激活函数; 7b建立由输入维度为16维、第一隐藏层为64维、第二隐藏层为256维、输出层为转录组基因数级联组成的RNA解码器,且除最后一层外其余层使用LeakyRelu函数作为激活函数,并设该解码器的最后一层的激活函数为exponential函数和softplus函数,这两个函数分别输出为基因表达分布的平均值和散度; 7c建立由输入维度为基因数,隐藏层分别为1024维、256维、64维、16维,最后投影到1维级联组成的RNA鉴别器,且除最后一层的1维不设置激活函数外,其余各层使用LeakyRelu函数作为激活函数; 7d将ATAC编码器,RNA解码器,RNA鉴别器级联组成染色质可及性ATAC生成转录组RNA模型,并采用Wasserstein距离作为损失函数; 8将步骤2预处理后的RNA数据和步骤3预处理后的ATAC数据输入染色质可及性ATAC生成转录组RNA模型通过WGAN的方法完成模型的预训练,再去除RNA鉴别器,并引入负二项分布损失NBLoss作为损失函数对预训练后的网络参数进行更新,得到训练好的染色质可及性ATAC生成转录组RNA模型; 9对不同组学的数据生成匹配的单细胞多组学数据: 9a对仅有单细胞转录组scRNA-seq数据,将步骤2预处理后的单细胞转录组数据输入到步骤6训练好的转录组RNA生成染色质可及性ATAC模型中,得到匹配的单细胞多组学数据; 9b对仅有单细胞染色质可及性scATAC-seq数据,将步骤3预处理后的单细胞染色质可及性数据输入到步骤8训练好的染色质可及性ATAC生成转录组RNA模型中,得到匹配的单细胞多组学数据。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。