安徽大学李海涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学申请的专利基于深度卷积神经网络的微拟球藻启动子可解释预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117219175B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311165448.4,技术领域涉及:G16B40/20;该发明授权基于深度卷积神经网络的微拟球藻启动子可解释预测方法是由李海涛;刘甘霖;郑春厚;苏延森设计研发完成,并于2023-09-11向国家知识产权局提交的专利申请。
本基于深度卷积神经网络的微拟球藻启动子可解释预测方法在说明书摘要公布了:本发明公开了一种基于深度卷积神经网络的微拟球藻启动子可解释预测方法,包括:1、微拟球藻启动子序列数据的收集和预处理;2、基于稠密连接卷积与注意力机制建立微拟球藻启动子分类网络;3、利用二分类交叉熵损失函数训练微拟球藻启动子分类网络,得到最优分类模型;4、基于残差连接与空洞卷积建立微拟球藻启动子重要性得分生成网络;5、利用预测损失与保存量损失训练微拟球藻启动子重要性得分生成网络,得到最优生成模型。本发明能够在不同的菌株数据上均得到较为准确的微拟球藻启动子分类预测结果,并基于启动子核苷酸的重要性得分对预测结果作出忠实的解释,从而为后续针对微拟球藻的研究提供工具与思路。
本发明授权基于深度卷积神经网络的微拟球藻启动子可解释预测方法在权利要求书中公布了:1.一种基于深度卷积神经网络的微拟球藻启动子可解释预测方法,其特征在于,是按如下步骤进行: 步骤1、微拟球藻启动子序列数据的收集和预处理: 步骤1.1、从获取的微拟球藻启动子数据中筛选出长度为W的序列,并使用拓展的CD-HIT-EST工具包对筛选后的序列进行去重处理,得到正样本数据集其中,表示正样本数据集S+中的第m个正样本,bm,i表示第m个正样本中第i个核苷酸的独热编码向量,M为正样本的总数; 步骤1.2、将正样本数据集S+中的第m个正样本划分为多个子序列片段{{bm,1,bm,2},…,{bm,i,bm,i+1},…,{bm,L-1,bm,W}},其中,{bm,i,bm,i+1}表示第m个正样本的第个子序列片段; 将第m个正样本中每个子序列片段内的核苷酸排列顺序进行随机打乱,得到与对应的第m个负样本从而获得负样本数据集 合并S+与S-获得预处理后的微拟球藻启动子数据集S={s1,…,sn,…,sN},其中,sn表示第n个序列样本,N=2M为样本的总数,令第n个序列样本sn的标签为flagn∈{0,1}; 步骤2、建立微拟球藻启动子分类网络,依次包括:初始卷积模块、主干卷积模块以及权重输出模块,并用于对第n个序列样本sn进行处理,得到归一化后的微拟球藻启动子二分类预测标签pn; 步骤3、利用式1构建二分类交叉熵损失函数L: 基于微拟球藻启动子数据集S={s1,…,sn,…,s2N}输入微拟球藻启动子分类网络中进行迭代训练,并计算二分类交叉熵损失函数L以更新网络参数,当训练迭代次数达到设定的次数时或所述二分类交叉熵损失函数L收敛时,训练停止,从而得到最优微拟球藻启动子分类模型; 步骤4、建立微拟球藻启动子重要性得分生成网络,依次包括:主干模块以及输出模块,并用于对第m个正样本进行处理,得到第m个正样本对应的重要性得分cm; 步骤5、微拟球藻启动子重要性得分生成网络的训练: 步骤5.1、利用式3得到正样本数据的背景分布bg: 步骤5.2、将cm的维度与的维度匹配,得到维度处理后的重要性得分从而利用式4得到扰动后的分布 步骤5.3、将第m个正样本输入到最优微拟球藻启动子分类模型进行处理,得到原始预测标签pm; 步骤5.4、使用SoftmaxStraight-Through采样方法从中采样出K个扰动样本并输入最优微拟球藻启动子分类模型中进行处理,得到与pm对应的K个扰动预测结果其中,表示从中采样出的第k个样本,表示经过最优微拟球藻启动子分类模型处理后输出的扰动预测标签; 步骤5.5、利用式5计算预测损失Lp: 步骤5.6、利用式6计算保存量损失Ls: 式6中,tbit为目标保存量的超参数,∑axis·表示对张量中所有维度中的元素进行求和; 步骤5.7、利用式7构建总体损失函数Ltotal: Ltotal=Lp+λ·Ls7 式7中,λ为平衡两种损失的权重超参数; 步骤5.8、将正样本数据集输入微拟球藻启动子重要性得分生成网络中进行训练,并计算总体损失函数Ltotal以更新网络参数,当训练迭代次数达到设定的次数或是总体损失函数Ltotal收敛时,训练停止,从而得到最优的微拟球藻启动子重要性得分生成模型,用于对最优微拟球藻启动子分类模型输出的预测标签进行重要性评价。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经济技术开发区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励