北京大学黄捷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京大学申请的专利预测非模式生物必需基因的数据处理装置及方法与应用获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120895108B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511438715.X,技术领域涉及:G16B40/00;该发明授权预测非模式生物必需基因的数据处理装置及方法与应用是由黄捷;陈雪梅设计研发完成,并于2025-10-10向国家知识产权局提交的专利申请。
本预测非模式生物必需基因的数据处理装置及方法与应用在说明书摘要公布了:本发明公开了生物信息学领域中预测非模式生物必需基因的数据处理装置及方法与应用。本发明所要解决的技术问题是如何筛选非模式生物的必需基因。本发明将目标物种的蛋白质序列和n种模式生物物种的蛋白质序列分别基于注释得到每种蛋白对应的标签;然后将蛋白质序列和标签嵌入蛋白质语言模型,输出嵌入向量;基于该嵌入向量为每一个蛋白质构建残基接触图;将残基接触图中每个氨基酸残基的特征使用图神经网络进行建模整合输出得到整体的蛋白质嵌入向量;将所有蛋白质嵌入向量输入分类器模型进行训练并使用激活函数输出蛋白质基因的必需概率值;基于分类器模型获得蛋白质所基因的必需概率值P1。本发明可应用于农业病害防控和生物农药开发。
本发明授权预测非模式生物必需基因的数据处理装置及方法与应用在权利要求书中公布了:1.一种数据处理装置,所述数据处理装置包括存储器、处理器及存储在存储器上的计算机程序,其特征在于:所述处理器执行所述计算机程序以实现如下步骤: A1将目标物种的蛋白质序列和n种模式生物物种的蛋白质序列分别基于注释得到每种蛋白对应的标签;所述目标物种的标签基于PHI-base数据库获得;在PHI-base数据库中被注释为“致死或lethal”或“减毒或reducedvirulence”的蛋白基因的所述标签为必需,作为弱监督正类;在PHI-base数据库中未被注释且无功能记录的蛋白基因的标签为非必需,为负类;A2将每一个所述蛋白质序列和其对应的所述标签嵌入蛋白质语言模型,输出所述蛋白质中氨基酸残基的上下文嵌入向量;基于所述上下文嵌入向量为每一个蛋白质构建残基接触图;所述蛋白质语言模型为ESM-2;所述基于所述上下文嵌入向量为基于模型注意力权重与残基间距离,构建无向图结构,得到所述残基接触图,由节点和边构成:节点为残基,边表示高注意力得分的残基对; A3使用图神经网络对所述残基接触图进行建模,以将所述残基接触图中每个氨基酸残基的特征整合输出得到蛋白质整体嵌入向量; A4将所有所述蛋白质整体嵌入向量输入分类器模型进行训练,使用激活函数将所述分类器模型输出为蛋白质所对应基因的必需概率值;基于所述分类器模型获得所述目标物种的蛋白质所对应基因的必需概率值P1; A5多组学特征融合:构建所述目标物种的蛋白互作网络,基于组学数据将所述蛋白互作网络的节点融合组学特征得到多组学蛋白互作网络;使用图神经网络模型对所述多组学蛋白互作网络进行建模,以将所述多组学蛋白互作网络中每个节点的组学特征进行非线性聚合;使用激活函数将所述图神经网络模型输出为蛋白质所对应基因的必需概率值P2; A6结果输出:根据所述必需概率值P1和所述必需概率值P2确定所述目标物种中每个蛋白质对应的基因是否为必需基因; 所述目标物种为非模式生物物种或基因注释不完全物种;所述n大于等于1。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100871 北京市海淀区颐和园路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励