华东师范大学黄一人获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华东师范大学申请的专利一种基于特征工程的基因编辑脱靶效应预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116364173B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310402256.4,技术领域涉及:G16B15/30;该发明授权一种基于特征工程的基因编辑脱靶效应预测方法是由黄一人;江振然设计研发完成,并于2023-04-14向国家知识产权局提交的专利申请。
本一种基于特征工程的基因编辑脱靶效应预测方法在说明书摘要公布了:本发明公开了一种基于特征工程的基因编辑脱靶效应预测方法,包括以下步骤:S1:获取公开数据集:获取包含sgRNA序列与目标DNA序列不匹配的公开实验数据作为可能的脱靶序列,所述数据集包括GUIDE‑Seq,HTGTS,BLESS;S2:每个序列样本长度为23个碱基,并以NGG结尾,对数据集标签进行预处理,将包含脱靶位点的样本标记为正样本,标签为1,不包含脱靶位点的样本标记为负样本,标签为0;S3:对样本数据集进行编码并加入特征。解决深度学习模型无法融合多样性特征以及数据集样本不平衡问题,提高CRISPRCas9脱靶预测精度和泛化能力,提升模型整体性能。
本发明授权一种基于特征工程的基因编辑脱靶效应预测方法在权利要求书中公布了:1.一种基于特征工程的基因编辑脱靶效应预测方法,其特征在于,包括以下步骤: S1:获取公开数据集:获取包含sgRNA序列与目标DNA序列不匹配的公开实验数据作为可能的脱靶序列,其中,所述数据集包括GUIDE-Seq,HTGTS,BLESS; S2:每个序列样本长度为23个碱基,并以NGG结尾,对数据集标签进行预处理,将包含脱靶位点的样本标记为正样本,标签为1,不包含脱靶位点的样本标记为负样本,标签为0; S3:对样本数据集进行编码并加入特征; S4:通过LSTM网络模型提取特征,其中,LSTM网络模型包括:卷积特征融合模块、门控循环单元特征融合模块、卷积层和密集层; S5:将序列特征得到分数与手工特征分数进行结合; S6:采用SMOTE方法对正样本进行过采样,并结合欠采样选出对应数量的负样本; S7:将处理后得到的数据集样本按照85%:15%的比例划分为训练集与测试集; S8:使用嵌入式特征选择对样本特征进行选择和过滤; S9:将训练好的模型使用测试集进行评估,评估指标采用Accuracy和AUC值,其中,Accuracy越高表示预测准确率越好,AUC越高表示预测稳定性和分类效果更优; 步骤S3中,具体包括以下步骤: 将A、T、G、C四个碱基与碱基缺失编码为五个one-hot独热向量1,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,1,使用或操作获得碱基对编码,同时,增加两个方向通道用于帮助区分碱基对类型; 使用LSTM网络对编码后的特征向量进行特征的学习,并得到一个基于序列特征的脱靶预测分数; 在步骤S5中,具体包括以下步骤: sgRNA与六个特征共同构成特征向量,并加入生物学特征,同时添加相应的二分类标签0或1,其中,六个特征包括:DNA对的CFD分数、CCTop分数、CRISTA分数、GC含量、错配个数和sgRNA-DNA序列相似性得分; 步骤S6还用于对噪音数据进行清洗,其中,在步骤S6中具体使用imblearn包的SMOTEENN方法获得最终的正负样本; 在步骤S8中,学习器采用DenseNet深度学习模型,网络结构由稠密块和过渡层组成,其中,稠密块,用于定义如何连接输入和输出,过渡层,用于控制通道数量,使模型不会太复杂; 采用DenseNet深度学习模型的具体流程为: DenseNet首先使用单卷积层和最大汇聚层,其中,加入批量正则化对应上述嵌入式特征选择过滤; 接下来使用4个稠密块,设置每个稠密块使用4个卷积层,稠密块里的卷积层通道数设为32,所以每个稠密块将增加128个通道,其中,在每个模块之间,DenseNet使用过渡层来减半高和宽,并减半通道数; 最后接上全局汇聚层和全连接层来输出结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励