东北林业大学李洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北林业大学申请的专利基于缺失模态生成的多模态药物分子预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120015169B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510077682.4,技术领域涉及:G16C20/50;该发明授权基于缺失模态生成的多模态药物分子预测方法是由李洋;汪国华;刘畅设计研发完成,并于2025-01-17向国家知识产权局提交的专利申请。
本基于缺失模态生成的多模态药物分子预测方法在说明书摘要公布了:基于缺失模态生成的多模态药物分子预测方法,本发明属于人工智能辅助药物研发领域,具体涉及多模态药物分子预测方法。本发明的目的是解决多模态分子‑文本预训练数据集规模受分子描述文本模态缺失的限制,模型难以充分捕捉分子图结构和文本之间的复杂关系,且现有多模态分子预训练模型在下游任务上的表现存在一定不足的问题。具体过程为:一:构建多模态分子预训练模型;二:对多模态分子预训练模型进行预训练,获得预训练好的多模态分子预训练模型;三:基于下游任务类型,对预训练好的多模态分子预训练模型进行微调,获得微调后的多模态分子预训练模型;四:基于微调后的多模态分子预训练模型对下游任务进行预测。
本发明授权基于缺失模态生成的多模态药物分子预测方法在权利要求书中公布了:1.基于缺失模态生成的多模态药物分子预测方法,其特征在于:所述方法具体过程为: 步骤一:构建多模态分子预训练模型MolBT; 步骤二:对多模态分子预训练模型MolBT进行预训练,获得预训练好的多模态分子预训练模型MolBT;具体过程为: 步骤三一、构建缺失模态重建损失,定义如下: 式中,Lrec表示缺失模态重建损失;Tk表示真实的文本浅层特征表示; 步骤三二、构建对比损失函数;具体过程为: 步骤三二一、令{g1,t1,g2,t2,…,gN,tN}为一个批次的分子-文本对,N=16; 其中, 分子gi及对应的分子描述文本ti构成正对gi,ti; 分子gi与不同分子的分子描述文本tj构成负对gi,tji≠j; 分子gi表示分子图和分子SMILES字符串; 步骤三二二、使用分子图结构编码器和分子序列编码器分别得到分子图结构表示gK、分子描述文本表示tK和分子SMILES字符串表示sK; gK、tK和sK输入到跨模态编码器,得到跨模态特征表示和 使用多层感知机MLP作为投影网络将四种表示gK、tK、投影到同一维度的特征空间中;公式如下所示: 式中,zG表示投影后的分子图结构特征表示;zT表示投影后的分子描述文本特征表示;cG表示投影后的分子图结构跨模态特征表示;cT表示投影后的分子描述文本跨模态特征表示; GraphProj表示分子图结构特征投影网络;TextProj表示分子描述文本特征投影网络; GraphProj'表示分子图结构跨模态特征投影网络;TextProj'表示分子描述文本跨模态特征投影网络; dg表示分子图结构特征的维度;dt表示分子描述文本特征的维度; 步骤三二三、采用对比损失计算zG,zT之间的对比损失函数l1;具体过程为: 记投影后的第i个分子图结构的特征表示为投影后的第j个分子图结构的特征表示为与第i个分子图结构gi相同的分子的分子描述文本的投影后特征表示为与第i个分子图结构gi不同的分子的分子描述文本tj的投影后特征表示为公式如下所示: 其中, 表示分子图结构-文本对比损失;表示文本-分子图结构对比损失; sim·,·表示余弦相似度; τ是温度超参数,设置为0.1; 步骤三二四、采用对比损失计算zG,cG之间的对比损失函数l2; 记投影后的第i个分子图结构的特征表示为投影后的第j个分子图结构的特征表示为第i个分子图结构的投影后的分子图结构跨模态特征表示为与第i个分子图结构gi不同的分子gj的投影后分子图结构跨模态特征表示为公式如下所示: 其中, 表示分子图结构特征-分子图结构跨模态特征对比损失;表示分子图结构跨模态特征-分子图结构特征对比损失; sim·,·表示余弦相似度; τ是温度超参数,设置为0.1; 步骤三二五、采用对比损失计算cG,cT之间的对比损失函数l3; 记投影后的第i个分子图结构的跨模态特征表示为投影后的第j个分子图结构的跨模态特征表示为与第i个分子图结构gi相同分子的分子描述文本的投影后的分子描述文本跨模态特征表示为与第i个分子图结构gi不同的分子的分子描述文本的投影后分子描述文本跨模态特征表示为公式如下所示: 其中, 表示分子图结构跨模态特征-文本跨模态特征对比损失;表示文本跨模态特征-分子图结构跨模态特征对比损失; sim·,·表示余弦相似度; τ是温度超参数,设置为0.1; 步骤三二六、基于对比损失函数l1、对比损失函数l2、对比损失函数l3,构建总对比损失函数LCL,表示为: LCL=l1+l2+l33 步骤三三、基于缺失模态重建损失Lrec和总对比损失函数LCL,构建缺失模态生成模块的损失函数Lmmg,表示为: Lmmg=αLrec+LCL 其中,α表示系数,α=5; 步骤三四、对多模态分子预训练模型MolBT进行训练,获得预训练好的多模态分子预训练模型MolBT; 步骤三:基于下游任务类型,对预训练好的多模态分子预训练模型MolBT进行微调,获得微调后的多模态分子预训练模型MolBT; 步骤四:基于微调后的多模态分子预训练模型MolBT对下游任务进行预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北林业大学,其通讯地址为:150040 黑龙江省哈尔滨市香坊区和兴路26号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励