上海交通大学袁野获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海交通大学申请的专利基于scGPT的小分子跨模态生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117316267B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311370274.5,技术领域涉及:G16B15/30;该发明授权基于scGPT的小分子跨模态生成方法是由袁野;张智科;程佳贝设计研发完成,并于2023-10-23向国家知识产权局提交的专利申请。
本基于scGPT的小分子跨模态生成方法在说明书摘要公布了:一种基于scGPT的小分子跨模态生成方法,用基因编码器与分子编码器分别对预处理后的基因转录谱与小分子数据编码并提取出特征后,用一个全连接层将两种模态映射到同一维度空间中并通过对比学习进行基因模态与小分子模态的多模态匹配;再将对齐后的基因向量通过自回归模型将基因模态转成小分子模态,最后将小分子向量还原成SMILES与Mol格式输出。本发明通过输入所需的基因表达谱和对照基因表达谱,得到能够诱导所需转录组谱的候选分子。
本发明授权基于scGPT的小分子跨模态生成方法在权利要求书中公布了:1.一种基于scGPT的小分子跨模态生成系统,其特征在于,包括:基因编码器、小分子编码器、小分子生成器、模态对齐器与模态转换器,其中:基因编码器使用的是开源的scGPT模型,分子编码器与生成器使用的是开源的hierVAE模型;模态对齐器用一个全连接层将两种模态映射到同一维度空间中并使用对比学习对齐;模态转换器将对齐后的基因向量以自回归的方式得到小分子向量; 所述的小分子跨模态生成是指:用基因编码器与分子编码器分别对预处理后的基因转录谱与小分子数据编码并提取出特征后,用一个全连接层将两种模态映射到同一维度空间中并通过对比学习进行基因模态与小分子模态的多模态匹配;再将对齐后的基因向量通过自回归模型将基因模态转成小分子模态,最后将小分子向量还原成SMILES与Mol格式输出; 所述的通过对比学习进行基因模态与小分子模态的多模态匹配,具体包括: 1将小分子编码经过一层全连接层映射到特定维度,再将实验组基因编码与对照组编码先作差得到基因差异表达编码,然后通过一层全连接层映射到和小分子映射后的相同维度; 2在一个批次中,每种小分子映射后向量都与它对应的基因向量构成正样本与其他基因向量组成负样本,使用InfoNCE损失函数将正样本的余弦相似度最大化并将负样本间的相似度最小化; 3反复迭代直到验证集损失连续5个轮次不再下降; 所述的通过自回归模型将基因模态转成小分子模态,具体包括: a通过PCA将对齐前小分子模态降维后将降维后的小分子模态全部展平,划分出1024个区间,并对每个区间标号,属于该区间的向量数值用区间标号替代,使得小分子编码离散化; b将对齐后的基因模态、基因模态的总体均值、离散化后的小分子编码组成一条序列,采用transformer神经网络逐一预测小分子编码,其中:transformer神经网络在初始状态只根据基因模态与总体均值来预测小分子的第一个序号,然后再结合基因模态、总体均值以及第一个序号来预测小分子的第二个序号,直到小分子编码预测完整; c使用PCA逆转换将离散化的小分子编码转换成连续的小分子编码。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海交通大学,其通讯地址为:200240 上海市闵行区东川路800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励