武汉大学刘娟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利基于拓扑感知注意力网络的蛋白质功能预测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118711672B 。
龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410802421.X,技术领域涉及:G16B40/00;该发明授权基于拓扑感知注意力网络的蛋白质功能预测方法及装置是由刘娟;张蔷;杨锋;黄伟鸿设计研发完成,并于2024-06-20向国家知识产权局提交的专利申请。
本基于拓扑感知注意力网络的蛋白质功能预测方法及装置在说明书摘要公布了:本发明提出了一种基于拓扑感知注意力网络的蛋白质功能预测方法及装置,其中的方法包括如下步骤S1:获取公开蛋白质功能注释数据集、公开的描述基因本体及关系obo文件;S2:构建蛋白质图输入和基因本体图输入;S3:搭建基于拓扑感知的蛋白质‑基因本体论注意力网络,其中包括拓扑感知的注意力模块和多头聚合器;S4:利用步骤S1中的数据对步骤S3中的拓扑感知的蛋白质‑基因本体注意力网络进行训练,得到训练好的蛋白质功能预测模型。S5:对待一个待预测功能的蛋白质,利用步骤S5中的训练好的模型生成其被每一个GO术语注释的概率。通过本发明的方法可以提升蛋白质功能预测的效果。
本发明授权基于拓扑感知注意力网络的蛋白质功能预测方法及装置在权利要求书中公布了:1.基于拓扑感知注意力网络的蛋白质功能预测方法,其特征在于,包括: S1:获取公开的蛋白质功能注释数据集、公开的描述基因本体及关系obo文件,其中公开的蛋白质功能注释数据集中的每条蛋白质序列都被多个GO术语进行注释; S2:根据公开的蛋白质功能注释数据集构建蛋白质图输入,根据公开的描述基因本体及关系obo文件构建基本体图输入; S3:搭建基于拓扑感知的蛋白质-基因本体论注意力网络,网络包括拓扑感知的注意力模块和多头聚合器,其中,拓扑感知的注意力模块用于从输入数据中提取拓扑感知的残基级别的嵌入和GO术语级别的嵌入,并将二者投影到联合语义空间,再利用注意力分数建模二者之间的拓扑语义相似度;多头聚合器用于对拓扑感知的注意力模块计算得到的相似度进行聚合,并计算蛋白质被GO术语注释的概率; S4:将所述蛋白质图输入和基本图输入作为训练数据输入基于拓扑感知的蛋白质-基因本体论注意力网络进行训练,得到训练好的蛋白质功能预测模型; S5:对于一个待预测功能的蛋白质,利用所述训练好的模型生成其被每一个GO术语注释的概率; 其中,步骤S3中拓扑感知的注意力模块的处理过程包括: 利用软掩码图神经网络从蛋白质图输入中提取拓扑感知的残基级别的嵌入; 利用图注意力网络从基因本体图输入中提取拓扑感知的GO术语级别的嵌入; 利用注意力机制将拓扑感知的残基级别的嵌入和拓扑感知的GO术语级别的嵌入投影到联合语义空间,利用注意力分数建模计算残基级别的嵌入和拓扑感知的GO术语级别的嵌入之间的拓扑语义相似度; 用Softmax函数对注意力分数进行激活,Softmax函数的定义为: 其中,为自然常数,表示以为底数以该相似度为指数的幂之和,为GO术语的个数,表示第i个GO术和j个残基之间的拓扑语义相似度,表示经过Softmax后的结果; 多头聚合器采用一个可训练的权重矩阵来分别聚合每一个GO术语与蛋白质的所有残基之间的语义相似度,聚合结果作为蛋白质被每一个GO术语注释的概率,具体方式为: 其中表示语义相似度矩阵中的第行,即第i个GO术语与蛋白质的所有残基之间的语义相似度,,表示偏置,为GO术语的个数,为蛋白质序列的长度,表示第个GO术语的第个聚合器头,,为聚合器头的数量;然后应用最大池化层,获得最终蛋白质被每一个GO术语注释的概率输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励