Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国海洋大学张树刚获国家专利权

中国海洋大学张树刚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国海洋大学申请的专利一种基于多尺度混合注意力网络的药物-靶点亲和力预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119649898B

龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411780185.2,技术领域涉及:G16B15/30;该发明授权一种基于多尺度混合注意力网络的药物-靶点亲和力预测方法是由张树刚;邢念文;李家任;魏志强;卢云;孙品;刘尚龙;解文韬;毕传林设计研发完成,并于2024-12-05向国家知识产权局提交的专利申请。

一种基于多尺度混合注意力网络的药物-靶点亲和力预测方法在说明书摘要公布了:本发明涉及药物‑靶点亲和力预测领域,特别涉及一种基于多尺度混合注意力网络的药物‑靶点亲和力预测方法。本发明通过利用自注意力机制,使得蛋白质口袋残基可以学习到全局的残基特征,实现了对蛋白质全局特征的学习。此外利用跨模态特征融合机制,使蛋白质和药物结构特征得到序列特征的增强,在增强实体内跨模态特征融合的同时,本发明同时利用跨实体交互模块,来识别药物分子的关键原子或蛋白质的关键残基,从而提高模型的整体性能。最后本发明进一步引进了多层次蛋白质特征提取以进一步提取蛋白质的特征。

本发明授权一种基于多尺度混合注意力网络的药物-靶点亲和力预测方法在权利要求书中公布了:1.一种基于多尺度混合注意力网络的药物-靶点亲和力预测方法,其特征在于,包括以下步骤: 步骤一:药物SMILES和分子图以及靶蛋白的残基序列和口袋图构建; 将药物分子用其自然序列描述符SMILES表示,该序列定义为Seqd={c1,c2,...,cm},其中每个元素cj是代表SMILES字符串中的化学键或原子的字符将药物SMILES转换为分子图,得到药物的图描述符Grad={Vd,Ed},Vd表示分子中包含原子的节点集,Ed是键边集;获得初始特征矩阵和邻接矩阵其中Nd=|Vd|表示图中原子节点的数量,Dd=63表示原子的特征维度,表示实数域,即本矩阵元素均为实数; 目标蛋白表示为残基序列Seqp={r1,r2,...,rn},其中每个元素ri代表一个残基;为局部蛋白口袋而不是整个蛋白质构建图;生成蛋白质口袋的描述符Grapocket={Vpocket,Epocket},Vpocket表示蛋白质口袋包含残基的节点集,Epocket表示任意两个残基的Cα原子对之间的欧氏距离生成边集,邻接矩阵其中Npocket=|Vpocket|表示口袋残基的节点数量; 步骤二:利用多头自注意力机制实现全局特征聚合; 将步骤一获得的残基序列Seqp输入嵌入层,生成初始表征其中n是蛋白质序列的长度,e是嵌入维度;接下来,将生成的数据通过正弦编码方案求解具有相同维度的位置编码,即将求解后的位置编码添加到初始表征Ep中,得到位置感知表征: Sp=Ep+PEp 然后使用相应的权重变换矩阵d是特征维度,dk代表查询矩阵和键矩阵的特征维度,dv代表值矩阵的特征维度将位置感知表征Sp变换为 即Q=XWQ,K=XWK,V=XWV;Q是查询矩阵,K是键矩阵,V是值矩阵;WQ,WK和WV是通过神经网络反向传播来训练出来的权重矩阵,随后,得到的注意力蛋白质表征通过下列公式计算: Sp,attn=MHSASp,Q,K,V 其中MHSA·代表多头自注意力, 对于药物分支,进行上述相同的步骤,将步骤一获得的药物序列Seqd输入嵌入层,生成初始表征其中m是药物SMILES序列的长度,e是嵌入维度;计算位置编码PEd并将其添加到Ed,并将位置感知药物特征Sd馈送到堆叠的自注意力块中以生成注意力药物表征: Sd,attn=MHSASd,Q,K,V 步骤三:提取蛋白质口袋内的残基特征 将步骤二获得的注意力蛋白质特征Sp,attn输入到蛋白质口袋特征提取模块,来获得蛋白质口袋残基表征Spocket,公式如下: Spocket=extractSp,attn,idxpocket 其中idxpocket是一组指示口袋内残基的索引,extract代表提取操作,其按照残基索引idxpocket,从蛋白质特征Sp,attn中提取对应的口袋残基表征;虽然只保留了口袋残基,但由于步骤二中的自注意力模块实现了任意成对残基间的信息聚合操作,因此每个口袋残基均包含了全局蛋白质信息,包括远程残基的特征,提取的特征作为初始特征矩阵Xpocket,即Xpocket=Spocket; 步骤四:跨模态特征融合 引入跨模态特征融合模块来提高原生单模态特征融合模块的表示能力,其是通过多头交叉注意力MHCA机制实现的,包括靶点特征的跨模态融合和药物特征的跨模态融合;最终得到跨模态融合阶段口袋的最终表征Gpocket,attn和药物在跨模态融合阶段的最终表征Gd,attn;其中, Gpocket,attn=MHCASpocket,Gpocket,Q,K,V Spocket表示顺序特征作为查询矩阵Q的源,并使用全局口袋图特征Gpocket构造其他两个矩阵K和V; Gd,attn=MHCASd,attn,Gd,Q,K,V Sd,attn表示顺序特征构建查询矩阵Q,使用药物图表征Gd构建其他两个矩阵K和V; 步骤五:跨实体特征交互 首先使用步骤四获得的跨模态融合阶段口袋的最终表征Gpocket,attn作为Q的来源,使用步骤四获得的药物在跨模态融合阶段的最终表征Gd,attn作为K和V的来源,通过多头交叉注意力得到增强药物表征Rd,计算公式如下: Rd=MHCAGpocket,attn,Gd,attn,Q,K,V 反过来,当Q来源于步骤四获得的药物在跨模态融合阶段的最终表征Gd,attn,K和V来源于步骤四获得的跨模态融合阶段口袋的最终表征Gpocket,attn时,通过多头交叉注意力得到增强蛋白质口袋表征Rpocket,计算公式如下所示: Rpocket=MHCAGd,attn,Gpocket,attn,Q,K,V 步骤六:多层次蛋白质特征提取 将步骤二经过嵌入层获得的Ep输入到引入的多层次蛋白序列编码器,用于进一步提取目标蛋白质特征,该编码器由多个基础CNN层以及分层池化读出模块组成,采用分层策略来整合不同尺度的输出;CNN操作和输出隐藏特征用公式表示为: 其中l=0,1,2,3表示第l层,是该层对应的隐藏表征,是嵌入的蛋白质序列;在这里序列长度被截断或填充为L,因为CNN要求输入具有固定长度,而L是取决于数据样本的超参数; 接下来,各个CNN层生成的隐藏表征通过分层池化读出模块读取并拼接,形成靶点蛋白的多层次表征;整体的公式表示如下所示: 其中||表示串联操作,W是可学习的权重,其中MaxPool·是最大池化层,它在输入的特征图上滑动一个窗口,该窗口称为池化窗口或池化核,在每个窗口内取最大值作为输出;这个过程会遍历整个特征图,直到到达边缘; 最后,将由Rd和步骤五生成的Rpocket组成的药物-靶点复合表征和分层蛋白质表征Rp连接起来进行最终预测,公式如下所示: 其中表示模型最终预测的药物-靶点亲和力值,Rd表示步骤五生成的增强过的药物表征,Rpocket表示步骤五生成的增强过的蛋白质口袋表征,Rp表示步骤六生成的分层蛋白质表征;注意,MLP·表示三个堆叠的MLP层;该模型通过最小化均方误差损失函数进行训练,公式如下所示: 其中Lmse表示最小化均方误差,表示根据模型预测的数据集中第n个样本的药物-靶点亲和力值,yn是数据集中第n个样本的基本事实,N表示总数样本数量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国海洋大学,其通讯地址为:266100 山东省青岛市崂山区松岭路238号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。