东北林业大学章天骄获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北林业大学申请的专利一种细胞特异性沉默子及其强度的识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117059175B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311031740.7,技术领域涉及:G16B40/30;该发明授权一种细胞特异性沉默子及其强度的识别方法是由章天骄;李良雨;汪国华设计研发完成,并于2023-08-16向国家知识产权局提交的专利申请。
本一种细胞特异性沉默子及其强度的识别方法在说明书摘要公布了:一种细胞特异性沉默子及其强度的识别方法,涉及生物信息技术领域,针对现有技术中单纯依赖沉默子序列的识别方法识别沉默子的准确率低的问题,本申请有效提高了识别特定细胞中沉默子的准确率,并且优于现有的识别沉默子方法,gkm‑SVM方法、DeepSilencer方法和SEPredict方法。同时,本申请首次提出基于多组学数据的复杂深度学习框架识别强沉默子和弱沉默子,并在独立测试集上取得较高的准确率。此外,本申请进一步分析了深度学习捕捉的与沉默子强相关的生物学组合信号。
本发明授权一种细胞特异性沉默子及其强度的识别方法在权利要求书中公布了:1.一种细胞特异性沉默子及其强度的识别方法,其特征在于包括以下步骤: 步骤一:获取每种细胞中的沉默子,所述沉默子以DNA序列形式表达; 步骤二:获取每种细胞的组蛋白修饰数据、染色质可及性数据以及多种转录因子数据; 步骤三:将沉默子进行归一化处理; 步骤四:将归一化处理后的沉默子进行k-mers编码,得到沉默子的序列特征向量Sseq; 步骤五:将特征向量Sseq进行去冗余,得到纯净序列特征矩阵 步骤六:将纯净序列特征矩阵输入第一DNN深度神经网络,得到多层次序列特征其中,l表示Dense层数,l取0,1,2,3,Dense层数即Dense0层、Dense1层、Dense2层以及Dense3层,之后对Dense3层输出的多层次序列特征进行Dropout操作,得到特征 步骤七:将表观遗传组数据和转录组数据对应的生物信号值作为沉默子的特征值,得到特征矩阵之后将特征矩阵输入CNN深度神经网络, 所述CNN深度神经网络中第一层卷积层过滤器个数为128, 第二层卷积层过滤器个数为64, 第三层卷积层过滤器个数为64, 第四层卷积层过滤器个数为128, 经过CNN深度神经网络中每个卷积层后,分别得到特征矩阵和 所述表观遗传组数据即组蛋白修饰数据,所述转录组数据即染色质可及性数据以及多种转录因子数据; 步骤八:计算中每种生物信号bj的注意力分数然后,通过Dot层的点积操作将注意力分数应用于特征矩阵进而得到加权后的特征矩阵其中,中每种生物信号bj的注意力分数表示为: fhj=tanhhjw1 其中w1、w2分别是形状为128×64和64×1的权重矩阵, 加权后的特征矩阵表示为: 其中,Permute表示排列函数操作; 步骤九:获取Dense1层和Dense2层输出的多层次序列特征和之后将和进行横向融合,得到序列特征矩阵然后将特征矩阵和进行横向融合,得到组学特征矩阵之后将和纵向融合为mLast,最后将序列特征矩阵和组学特征矩阵进行多模态融合,得到沉默子对应的多特征矩阵 步骤十:根据步骤一中每种细胞中沉默子,从整个人类参考基因组中随机选择一段与每种细胞中沉默子长度相等且位于相同染色体的其他DNA序列,之后将该DNA序列作为非沉默子,所述非沉默子以DNA序列形式表达; 从整个人类参考基因组中随机选择DNA序列时,应满足非沉默子序列避开编码与非编码基因的启动子、编码与非编码基因的外显子区域以及增强子区域,且选取的DNA序列并非其他沉默子对应DNA序列; 步骤十一:以步骤十中非沉默子替换步骤一中沉默子,并重复步骤一至步骤九,得到非沉默子对应的多特征矩阵msum2,并利用沉默子对应的多特征矩阵msum1以及非沉默子对应的多特征矩阵msum2训练第二DNN深度神经网络; 步骤十二:根据步骤一中获取的每种细胞中沉默子,获取每个沉默子的log2FC值,若log2FC-0.50,则该沉默子为弱沉默子,若log2FC≤-0.50,则该沉默子为强沉默子; 步骤十三:利用强沉默子和弱沉默子,并重复步骤一至步骤九,分别得到强沉默子对应的多特征矩阵msum3和弱沉默子对应的多特征矩阵msum4,并利用强沉默子对应的多特征矩阵msum3和弱沉默子对应的多特征矩阵msum4训练第三DNN深度神经网络,得到训练好的第三DNN深度神经网络; 所述训练第二DNN深度神经网络和第三DNN深度神经网络的具体步骤为: 首先,将多特征矩阵msum1和msum2分别通过DNN深度神经网络中的Flatten层,展平为一个连续的特征向量并保持其中的元素顺序不变,然后将特征向量送入包含3层Dense层的全连接网络进行线性变换,将每一Dense层的输出均通过ReLU激活函数,并在第二Dense层加入Dropout正则化,最后将第三Dense层输出的结果输入全连接层,随后经过Sigmoid激活函数输出预测结果; 步骤十四:基于待识别的DNA序列数据,将其输入训练好的第二DNN深度神经网络,得到DNA序列是沉默子的概率; 步骤十五:若步骤十四中DNA序列数据是沉默子的概率大于0.5,则认为该DNA序列数据是沉默子,否则不是; 步骤十六:若该DNA序列数据是沉默子,则将该DNA序列数据输入训练好的第三DNN深度神经网络,得到DNA序列是强沉默子的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北林业大学,其通讯地址为:150040 黑龙江省哈尔滨市香坊区和兴路26号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励