西安电子科技大学高琳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利基于单细胞转录组数据的细胞类型注释方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116913394B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310849793.3,技术领域涉及:G16B50/10;该发明授权基于单细胞转录组数据的细胞类型注释方法是由高琳;李超;胡宇轩;许晗设计研发完成,并于2023-07-12向国家知识产权局提交的专利申请。
本基于单细胞转录组数据的细胞类型注释方法在说明书摘要公布了:本发明公开了一种基于单细胞转录组数据的细胞类型注释方法,主要解决现有技术不能正确表示细胞类型层次关系的问题,以及在层次关系复杂的数据集上分类精度低的问题。本发明构建细胞类型层次关系图,然后对细胞类型进行层次分类。由于构建的细胞类型层次关系图为有向无环图,本发明能表示复杂的细胞类型层次关系。本发明使用双曲蕴含锥网络,能在不同粒度上精确分配细胞类型标签。利用细胞类型层次关系图构建和采样标签,降低了训练网络的复杂度,进一步提升了分类性能。
本发明授权基于单细胞转录组数据的细胞类型注释方法在权利要求书中公布了:1.一种基于单细胞转录组数据的细胞类型注释方法,其特征在于,构建细胞类型层次关系图,构建双曲蕴含锥网络:该注释方法的步骤如下: 步骤1,生成训练集: 将至少2000个细胞的基因表达数据组成样本集,该样本集中至少包含10种细胞类型,每个细胞的基因表达数据至少包含五个非零的基因表达值;对样本集中的每个细胞的基因表达数据进行库标准化、过滤低表达的基因的预处理,将所有预处理后的样本组成训练集; 步骤2,构建细胞类型层次关系图; 步骤3,构建训练集中每个样本的正、负标签集; 步骤4,构建双曲蕴含锥网络: 搭建由样本嵌入子网络、标签嵌入子网络并联组成的双曲蕴含锥网络; 所述样本嵌入子网络由结构相同的输入单元、输出单元依次串联组成,每个单元均由线性层、正则化层、激活层依次串联组成;将线性层的输入维度和输出维度分别设置为n*64、64*64,n的取值等于训练集中基因的总数,将正则化层的大小设置为64,激活层采用ELU函数实现; 所述标签嵌入子网络由torch.nn.Embedding函数实现;将torch.nn.Embedding函数中的num_embeddings设置为c,c的取值等于细胞类型层次关系图中节点数量,将embedding_dim设置为64,将max_norm设置为1.0; 步骤5,训练双曲蕴含锥网络: 设置网络训练参数,将训练集中每个样本在正、负标签集中进行标签采样,利用细胞类型层次关系图中的距离作为负标签采样的权重概率,将该样本所对应的标签、正类标签、负类标签依次拼接作为该样本的采样标签;将该样本与采样标签分别输入到样本嵌入子网络和标签嵌入子网络中,根据两个子网络输出的嵌入向量通过惩罚函数约束偏序关系,计算损失函数值,使用自适应梯度下降算法同时迭代更新两个子网络的参数,直到损失函数收敛为止,得到训练好的双曲蕴含锥网络; 步骤6,对待标注的细胞进行分类: 对待标注的细胞的基因表达数据,采用与步骤1相同的库标准化后输入到训练好的双曲蕴含锥网络中,对网络输出的嵌入向量与训练集中每个细胞类型的嵌入向量计算惩罚函数的值,筛选其中值小于阈值的所有细胞类型,作为该细胞的细胞类型标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。