电子科技大学李骁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种基于多源相似度矩阵核融合的协同药物预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117831611B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410018914.4,技术领域涉及:G16B15/30;该发明授权一种基于多源相似度矩阵核融合的协同药物预测方法是由李骁;朱嘉静;刘勇国;陆鑫;李巧勤;张云设计研发完成,并于2024-01-05向国家知识产权局提交的专利申请。
本一种基于多源相似度矩阵核融合的协同药物预测方法在说明书摘要公布了:本发明属于协同药物预测技术领域,涉及一种基于多源相似度矩阵核融合的协同药物预测方法。本发明首先通过引入酶和通路两个描述药物ADMET特征的信息,克服了药物结构、ATC编码和靶点等特征提供信息单一的缺点;其次,采用重启随机游走算法对相似度矩阵进行处理,并使用Spearman等级相关系数计算不同相似度矩阵下各节点间的拓扑相似性,克服了现有方法未考虑不同药物相似度网络之间的交互信息的缺点,使模型更全面地捕捉药物相似度的多维度特征;最后,采用核融合网络对五个拓扑相似度矩阵进行融合处理,有效地非线性整合药物在不同条件下的拓扑相似度矩阵,克服了现有方法简单地将所有相似度矩阵以平均和的方式融合所导致的掩盖不同的药物特征重要性差异。
本发明授权一种基于多源相似度矩阵核融合的协同药物预测方法在权利要求书中公布了:1.一种基于多源相似度矩阵核融合的协同药物预测方法,其特征在于,包括以下步骤: S1、基于药物分子的SMILES,利用RDKit工具生成药物分子对应的二维无向图G=V,E,其中V是节点集,E是边集,定义N=|V|表示节点总数; S2、利用多跳子图随机游走检测药物社区团,具体为:通过播种的方式,从每个种子中的节点一致地开始计算转移概率向量,将图G中每个节点的转移概率向量看作是向量空间中的一个点,并使用谱聚类算法将这些向量聚类成不同的社区团,从而得到每个种子扩展的药物社区团;所述转移概率向量的计算方式为: 先通过下式计算出起始节点u的k跳邻居子图中扩展了mk个药物社区团后转移概率向量: , 其中,Iu为第u个元素为1、其余元素为0的向量,αk∈0,1为衰减参数,为在节点u的k跳邻居子图上,以u为起始节点,扩展到第mk个药物社区团后的随机游走动态转移矩阵: , 其中,为节点u的k跳邻居子图的邻接矩阵,为邻接矩阵的度矩阵,为扩展到第mk个药物社区团后的加权矩阵: , 其中,μ1>0,0μ2μ31,nvi表示第i个节点vi从属的药物社区团数,λu,kij表示子图中第i个节点与第j个节点之间的跳转权重: , 其中,linkki,j表示子图中第i个节点与第j个节点在原始图G中的经过k-1个节点链接的相连链路数,Nki表示子图中第i个节点的邻居节点集合; 最终得到起始节点u的转移概率向量为: , 其中,ωi为概率融合权重,满足ω1ω2...ωk0且ω1+ω2+...+ωk=1,i=1,2,...,k; 将得到的药物社区团中相似度大于阈值的两个药物社区团进行融合得到n个药物社区团C={c1,c2,...,cn},其中0n≤π,π是设定的种子数量;将得到的n个药物社区团按照传导性升序排序,仅保留前a个社区团,将其余社区团全部解散,以保留下来的a个社区团为指导重新进行新一轮的多跳子图随机游走,依此迭代t次后,得到最终的药物社区团C={c1,c2,...,cs},其中s为最终的药物社区团数量;所述传导性是药物社区团的适应度函数: , , 其中,Lc表示社区团内节点的外部链接总数,M表示图G中的边数,du代表节点u的度数,社区团c的传导性Ψc越低,则表示该社区团的内聚性越高; S3、利用第一个MPNN模块提取药物社区团局部特征: 使用每一个节点u的转移概率向量pu对消息传递函数进行加权优化: , 其中,为从节点v传递到节点u的信息向量,为第l-1层上节点u的特征向量,为第l-1层上节点v的特征向量,是指示节点v和节点u之间是否存在边的属性值,若存在边,则,否则,puv表示节点u向节点v转移的概率; 使用概率融合权重对聚合函数进行加权优化: , 其中,是节点u的l跳邻居节点向其传递的特征总和,是节点u的邻居节点集合,代表第l跳子图转移概率的融合权重,在对所有l跳节点传递的特征进行聚合时进行加权,l=1,2,...,k; 对于每一个社区团ci所构成的二维图,利用优化消息传递函数和消息聚合函数后的MPNN按照以下方式进行消息传递、消息聚合和节点表示更新以提取图特征: , , , , 其中,MPNN模块的输入为图中每一个节点的初始特征,初始特征由图G嵌入初始化,Massage∙为消息传递函数,用于传递节点u的邻居节点的特征信息;Aggregation∙为聚合函数,用于聚合节点u的所有邻居节点所传递的特征信息;Update∙为更新函数,用于更新节点u的特征信息;Read∙为读出函数,用于提取整张药物社区团子图的特征向量,最终得到药物社区团ci的特征向量,i=1,2,...,s,该特征对应药物的社区团局部特征,T代表转置操作; S4、利用第二个MPNN模块提取药物全局特征: 将每个社区团视为一个节点,节点的特征为社区团的特征,依据各社区团之间的原始链接关系,构造社区团子图Gcom,然后采用与S3中的方法相同,利用MPNN进行消息传递、消息聚合和节点表示更新以提取社区团子图Gcom的特征,该特征对应药物的全局特征; 最终,药物的特征矩阵由药物局部特征和全局特征构成,表示为: , 其中,为药物社区团ci的特征向量,其中i取值为1~s,为社区团子图的特征向量,,q为特征维度; S5、构建药物相似度矩阵: 定义药物多源信息包括药物结构信息、药物-靶点关联信息、药物-酶关联信息、药物-通路关联信息和药物的ATC编码信息,从相关数据库中分别提取与药物相关的靶点信息、酶信息和通路信息,对于第i个药物di,将靶点特征、通路特征和酶特征分别定义为: , , , 其中,x、y、z分别表示提取得到的靶点数、通路数和酶数,元素til、pil、eil的取值为1或0,为1表示第l个对应特征与药物di相关联,为0表示不关联; 使用Jaccard相似性系数来计算第i个药物和第j个药物之间的相似度: , 其中,代表计算药物i和药物j在*特征下的Jaccard相似度,*为target、path或enzyme;从而分别得到靶点、通路和酶三种特征条件下的药物相似度矩阵、和,M为药物总数; 定义由向量表示的ATC编码由B个条目组成,每个条目表示ATC层次结构中相应级别的子代码,设定两个向量的前A个条目相同,从而两种药物之间的ATC相似度为,得到ATC特征条件下的药物相似度矩阵; 采用希尔伯特-施密特独立准则计算不同药物间的结构相似性: , 其中,代表HSIC函数,和分别代表第i个药物的结构特征和第j个药物的结构特征,,,H是中心化核矩阵,由计算得到,其中I为单位矩阵,e为q维全1向量,Tr·表示求矩阵的迹,即对角线上元素的和,T代表转置操作,得到药物结构条件下的药物相似度矩阵; S6、构造拓扑相似度矩阵: 采用基于重启随机游走算法对S5得到的药物相似度矩阵进行处理: , 其中,Pt为第t个时间步下的状态转移矩阵,其第i个元素代表药物di在第t个时间步的置信度评分;P0为初始状态转移矩阵,其第i个元素为1,其余元素为0;是控制局部和全局拓扑信息的相对影响的重启概率;W为归一化的相似度矩阵,表示为,代表*条件下第i个药物和第j个药物之间的相似度评分、代表相似度矩阵,*为struct、atc、target、path或enzyme;当Δp=pt−pt−1的L1范数小于正数ε=10−9时,得到一个平稳分布向量p,它为一个药物节点的扩散状态; 定义表示在相似度矩阵下第i个药物节点的扩散状态,得到所有pi构成的扩散状态矩阵,其中i=1,...,M,M为药物总数; 使用Spearman等级相关系数计算不同药物相似度矩阵、各节点间的拓扑相似性: , 其中,代表以信息源*中第i个药物扩散状态矩阵和信息源#中第j个药物扩散状态矩阵为条件计算得到的Spearman等级相关系数,代表扩散状态矩阵的第i行、第k列对应的元素; 将每一个药物相似度矩阵与其余四个药物相似度矩阵联合,以当前信息源下药物节点的扩散状态与其他信息源下其余药物节点的扩散状态为基础,计算当前信息源下各药物与其余信息源下各药物之间的Spearman等级相关系数的数值,每个药物与其余药物的Spearman等级相关系数数值共有四个,对这四个值进行平均融合,以此构造拓扑相似度矩阵,分别为:从药物结构的角度出发,去其余信息源中捕获、融合各药物节点的拓扑信息,得到拓扑相似度矩阵Nstruct;从药物ATC编码的角度出发,去其余信息源中捕获、融合各药物节点的拓扑信息,得到拓扑相似度矩阵Natc;从药物靶点的角度出发,去其余信息源中捕获、融合各药物节点的拓扑信息,得到拓扑相似度矩阵Ntarget;从药物通路的角度出发,去其余信息源中捕获、融合各药物节点的拓扑信息,得到拓扑相似度矩阵Npath;从酶的角度出发,去其余信息源中捕获、融合各药物节点的拓扑信息,得到拓扑相似度矩阵Nenmyze; S7、对拓扑相似度矩阵进行核融合: 将由S6得到的5个相似度矩阵构成第一层的核张量,表示为: , 每个基本核表示中第i个元素和第j个元素的拓扑相似性得分,通过卷积运算,具有5个不同基本核的核张量将转换为具有5个基本核的新张量: , 其中,是一个滤波器组,每个是可学习的滤波器参数向量,l=1,...,5,是一个微分非线性标量激活函数;卷积运算符以核张量和五个滤波器作为输入,并为每一个滤波器生成一个基本核: , 其中,代表第1层的第l个滤波器中的第k个元素;每个滤波器的卷积运算输出M×M大小的核,通过中的五个卷积运算,将从M×M×5的张量转换为M×M×5的新张量; 从第一层核张量开始,具有L层的核融合网络通过非线性滤波器链处理张量: , 这些滤波器逐渐将低层次的核张量逐步转化为高度非线性的基本核组合: , 其中,表示滤波器组所涉及的可训练参数;表示核融合网络第L-1层的输出,通过监督学习来学习滤波器参数; S8、构建深度神经网络来预测药物对是否协同: , , 其中,为融合相似度矩阵,是药物协同预测标签矩阵;代表整个预测模型,为模型中涉及的所有参数构成的集合;Zout和Zk是隐藏神经元,k=1,...,l,对应的权重矩阵Wout和Wk,bout和bk是偏置向量;是Sigmoid激活函数;是Softmax激活函数,用于最后一层,将输出层的值转换为概率,将中大于0.5的元素值置为1,小于等于0.5的元素值置为0。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新西区西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励