中山大学丁俊军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中山大学申请的专利一种预测相分离驱动残基的方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117012269B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310763821.X,技术领域涉及:G16B15/20;该发明授权一种预测相分离驱动残基的方法和系统是由丁俊军;孙隽;曲佳乐;赵偲设计研发完成,并于2023-06-26向国家知识产权局提交的专利申请。
本一种预测相分离驱动残基的方法和系统在说明书摘要公布了:本发明公开一种预测相分离驱动残基的方法和系统,通过整合蛋白质多维度的序列信息和功能信息,比如词向量、序列进化信息、氨基酸组成等,构建相分离蛋白预测及驱动残基识别的机器学习模型。基于不同氨基酸序列变化对应的相分离预测概率变化,可以量化每个氨基酸对蛋白质相分离能力的贡献。基于PSPHunter计算每个单元缺失蛋白质的相分离概率,分数越低,该单元对相分离的影响越大,截断之后对应的相分离能力变化最大的氨基酸被认为是相分离驱动残基,影响都相对较大并形成谷地的区域被认为是驱动区域。本发明实现相分离蛋白的预测和驱动残基识别,可进一步用于量化致病突变对相分离的影响,并提供剖析相分离与疾病关系的分析框架。
本发明授权一种预测相分离驱动残基的方法和系统在权利要求书中公布了:1.一种预测相分离驱动残基的方法,其特征在于,包括以下步骤: S1:收集实验验证的相分离蛋白和背景蛋白,根据所述相分离蛋白和背景蛋白建立训练数据集和独立测试数据集; S2:构建分类模型,所述分类模型的输入为根据蛋白质中特定序列计算得到的基于序列属性特征和功能特征,所述分类模型的输出为该特定序列的相分离概率; S3:利用所述训练数据集训练所述分类模型,利用所述独立测试数据集测试所述分类模型,得到最终的分类模型; S4:将全长的蛋白质序列逐次截断为特定长度的片段,对于每一片段,利用所述最终的分类模型计算缺失该片段的蛋白质序列的相分离概率,形成每一个氨基酸对于蛋白质成相能力影响的曲线; S5:根据所述曲线中相较于曲线均值偏离程度大的区域,得到驱动残基的具体位置; 步骤S2中所述基于序列属性特征包括氨基酸组成、进化保守性、预测的功能位点注释和词向量,所述功能特征包括蛋白质功能注释信息和网络属性; 所述进化保守性具体为: 对一个包含蛋白质序列进化信息的序列图谱PSSM,对于每个待搜索的蛋白质序列,使用PSI-BLAST程序对NCBI的NR数据库进行搜索,参数j=3,e=0.001,得到一个矩阵,所述矩阵代表所有20种氨基酸在特定位置的替换频率; 对矩阵的每一行进行了Z-score转换,然后对每一列,计算每个氨基酸的平均得分,矩阵被压缩成为一个20维的向量表征每一种氨基酸类型的进化属性,然后,按极性、带电、疏水和GP氨基酸总结了每种类别的平均分数,用一个四维向量表示; 氨基酸保护得分的分布:查询序列的每个氨基酸都获得了一个保守分数,保守分数为相对熵,能够表征其进化特征,计算5个统计特征,包括最大、最小、第一四分位数、第二四分位数和第三四分位数,该5个统计特征作为一个五维向量被用来表示氨基酸保守得分; 搜索查询:每个蛋白质的HMM轮廓首先按行进行Z-score归一化,然后按列进行平均,这产生对每个氨基酸的20维向量,根据极性、带电、疏水和GP的氨基酸类别,将这20维向量进一步浓缩为4维。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510275 广东省广州市海珠区新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励