上海算法创新研究院;北京深势科技有限公司温翰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海算法创新研究院;北京深势科技有限公司申请的专利一种tRNA适应指数权重预测模型的处理方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119207560B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411470052.5,技术领域涉及:G16B25/00;该发明授权一种tRNA适应指数权重预测模型的处理方法和装置是由温翰;李永歌;顾睿初;王喜;龚禹桥;司端淼;张林峰设计研发完成,并于2024-10-21向国家知识产权局提交的专利申请。
本一种tRNA适应指数权重预测模型的处理方法和装置在说明书摘要公布了:本发明实施例涉及一种tRNA适应指数权重预测模型的处理方法和装置,所述方法包括:构建适应指数权重预测模型和三个下游任务模型;基于目标物种数据集对四个模型进行训练;训练结束后对用户输入的实验条件、基因组序列和目标基因进行预处理得到对应的实验条件编码向量、基因组序列编码向量、tRNA基因拷贝数向量和目标基因密码子索引集;并由适应指数权重预测模型根据基因组序列编码向量、实验条件编码向量和tRNA基因拷贝数向量进行预测得到适应指数权重向量,并由三个下游任务模型分别根据适应指数权重向量和目标基因密码子索引集对目标基因的转录效率、翻译效率和基因丰度进行预测。通过本发明可以提高物种适配性和预测稳定性。
本发明授权一种tRNA适应指数权重预测模型的处理方法和装置在权利要求书中公布了:1.一种tRNA适应指数权重预测模型的处理方法,其特征在于,所述方法包括: 构建一个用于处理tRNA适应指数权重预测任务的适应指数权重预测模型;并设计三个下游任务模型:转录效率预测模型、翻译效率预测模型和基因丰度预测模型; 对目标物种在不同条件下的基因组序列进行数据采集并基于采集数据构建第一数据集;并基于所述第一数据集对所述适应指数权重预测模型和三个下游任务模型进行模型训练; 模型训练结束后,接收用户输入的当前实验条件、当前基因组序列和当前目标基因;并对所述当前实验条件、所述当前基因组序列和所述当前目标基因进行预处理得到对应的当前实验条件编码向量、当前基因组序列编码向量、当前tRNA基因拷贝数向量和当前目标基因密码子索引集;所述当前基因组序列为所述目标物种的一类细胞在所述当前实验条件下被观测者通过人工或机器观测实验手段得到的基因组序列;所述当前目标基因为所述当前基因组序列中的一种DNA基因或合成基因; 由所述适应指数权重预测模型根据所述当前基因组序列编码向量、所述当前实验条件编码向量和所述当前tRNA基因拷贝数向量进行tRNA适应指数权重预测处理得到对应的当前适应指数权重向量;并由三个下游任务模型分别根据所述当前适应指数权重向量和所述当前目标基因密码子索引集进行对应的转录效率、翻译效率和基因丰度预测处理得到对应的当前转录效率、当前翻译效率和当前基因丰度组成对应的任务报告向用户反馈; 其中,所述适应指数权重预测模型用于根据输入的基因组序列编码向量A、实验条件编码向量B和tRNA基因拷贝数向量C进行tRNA适应指数权重预测处理并输出对应的适应指数权重向量W; 所述基因组序列编码向量A由密码子编码向量AC和反密码子编码向量AAC拼接而成;所述密码子编码向量AC由对应的基因组序列的所有密码子类型的密码子编码ci顺序排序而成;所述反密码子编码向量AAC由对应的基因组序列的所有反密码子类型的反密码子编码acj顺序排序而成;所述密码子编码ci的总数记为NC,所述反密码子编码acj的总数记为NAC,1≤i≤NC,1≤j≤NAC;所述密码子编码ci和所述反密码子编码acj各为一个三联碱基编码; 所述实验条件编码向量B至少包括温度编码、湿度编码、光照编码、营养条件编码、生理培养阶段编码; 所述tRNA基因拷贝数向量C由NAC个基因拷贝数tGCNj组成;所述基因拷贝数tGCNj与所述反密码子编码acj一一对应; 所述适应指数权重向量W由NC个适应指数权重wi组成;所述适应指数权重wi与所述密码子编码ci一一对应; 所述适应指数权重预测模型的第一模型输入端、第二模型输入端和第三模型输入端分别用于接收对应的所述基因组序列编码向量A、所述实验条件编码向量B和所述tRNA基因拷贝数向量C,模型输出端用于输出对应的所述适应指数权重向量W; 所述适应指数权重预测模型包括Uni-RNA模型、第一MLP模型、第二MLP模型、特征融合模块、第三MLP模型和适应指数权重估算模块; 所述Uni-RNA模型的输入端与所述第一模型输入端连接,输出端分别与第一、第二MLP模型的输入端连接;第一、第二MLP模型的输出端分别与所述特征融合模块的第二、第三输入端连接;所述特征融合模块的第一输入端与所述第二模型输入端连接,输出端与所述第三MLP模型的输入端连接;所述第三MLP模型的输出端与所述适应指数权重估算模块的第二输入端连接;所述适应指数权重估算模块的第一输入端与所述第三模型输入端连接,输出端与所述模型输出端连接; 所述Uni-RNA模型已完成预训练;所述Uni-RNA模型用于对所述基因组序列编码向量A进行特征编码得到对应的编码特征X向第一、第二MLP模型发送; 所述第一MLP模型用于根据所述编码特征X对各个反密码子类型对应的tRNA基因细胞内浓度进行预测得到对应的浓度预测向量P向所述特征融合模块发送;所述浓度预测向量P由NAC个预测浓度pj组成,所述预测浓度pj与所述反密码子编码acj一一对应; 所述第二MLP模型用于根据所述编码特征X对每组密码子-反密码子类型对的配对概率进行预测得到对应的配对概率矩阵M向所述特征融合模块发送;所述配对概率矩阵M的形状为NC×NAC,由NC×NAC个配对概率mi,j组成;每个所述配对概率mi,j与一组所述密码子编码ci和所述反密码子编码acj对应; 所述特征融合模块用于对所述配对概率矩阵M进行降维处理得到对应的配对概率向量VM;并对所述配对概率向量VM、所述浓度预测向量P和所述实验条件编码向量B进行向量拼接得到对应的拼接向量R向所述第三MLP模型发送; 所述第三MLP模型用于根据所述拼接向量R对每组密码子-反密码子类型对的耦合系数进行预测得到对应的耦合系数张量S向所述适应指数权重估算模块发送;所述耦合系数张量S的形状为NC×NAC,由NC×NAC个耦合系数si,j组成;每个所述耦合系数si,j与一组所述密码子编码ci和所述反密码子编码acj对应; 所述适应指数权重估算模块用于根据所述tRNA基因拷贝数向量C和所述耦合系数张量S对各个密码子类型的适应指数权重进行估算得到对应的适应指数权重向量W;所述适应指数权重向量W由NC个适应指数权重wi组成;所述适应指数权重wi与所述密码子编码ci一一对应;所述适应指数权重wi的估算公式为:; 所述转录效率预测模型用于根据输入的所述适应指数权重向量W和目标基因密码子索引集G对指定目标基因的转录效率进行预测处理并输出对应的转录效率TPE; 所述目标基因密码子索引集G由指定目标基因的所有密码子类型对应的密码子索引组成; 所述转录效率预测模型包括第一分筛模块和第四MLP模型;所述第一分筛模块输入端与所述转录效率预测模型的输入端连接,输出端与所述第四MLP模型的输入端连接;所述第四MLP模型的输出端与所述转录效率预测模型的输出端连接; 所述第一分筛模块用于将所述适应指数权重向量W中索引i与所述目标基因密码子索引集G的各个所述密码子索引匹配的所述适应指数权重wi提取出来组成对应的第一权重向量向所述第四MLP模型发送;所述第四MLP模型用于根据所述第一权重向量进行转录效率预测得到对应的所述转录效率TPE并输出; 所述翻译效率预测模型用于根据输入的所述适应指数权重向量W和目标基因密码子索引集G对指定目标基因的翻译效率进行预测处理并输出对应的翻译效率TLE; 所述翻译效率预测模型包括第二分筛模块和第五MLP模型;所述第二分筛模块输入端与所述翻译效率预测模型的输入端连接,输出端与所述第五MLP模型的输入端连接;所述第五MLP模型的输出端与所述翻译效率预测模型的输出端连接; 所述第二分筛模块用于将所述适应指数权重向量W中索引i与所述目标基因密码子索引集G的各个所述密码子索引匹配的所述适应指数权重wi提取出来组成对应的第二权重向量向所述第五MLP模型发送;所述第五MLP模型用于根据所述第二权重向量进行翻译效率预测得到对应的所述基因翻译效率TLE并输出; 所述基因丰度预测模型用于根据输入的所述适应指数权重向量W和目标基因密码子索引集G对指定目标基因的基因丰度进行预测处理并输出对应的基因丰度TGA; 所述基因丰度预测模型包括第三分筛模块和第六MLP模型;所述第三分筛模块输入端与所述基因丰度预测模型的输入端连接,输出端与所述第六MLP模型的输入端连接;所述第六MLP模型的输出端与所述基因丰度预测模型的输出端连接; 所述第三分筛模块用于将所述适应指数权重向量W中索引i与所述目标基因密码子索引集G的各个所述密码子索引匹配的所述适应指数权重wi提取出来组成对应的第三权重向量向所述第六MLP模型发送;所述第六MLP模型用于根据所述第三权重向量进行基因丰度预测得到对应的所述基因丰度TGA并输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海算法创新研究院;北京深势科技有限公司,其通讯地址为:201306 上海市浦东新区南汇新城镇环湖西一路333号城投大厦1号楼2楼219室、221室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。