吉林大学;通化师范学院孙铭蔚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉吉林大学;通化师范学院申请的专利一种抗癌肽识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117292742B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311138515.3,技术领域涉及:G16B5/00;该发明授权一种抗癌肽识别方法及系统是由孙铭蔚;周柚;胡昊元;佘燕达;肖钰彬;李沅书设计研发完成,并于2023-09-05向国家知识产权局提交的专利申请。
本一种抗癌肽识别方法及系统在说明书摘要公布了:本发明适用于肽识别技术领域,提供了一种抗癌肽识别方法及系统,识别方法包括以下步骤:输入给定的肽序列,对肽序列进行数据增强,得到原始序列;第一通道使用Bi‑LSTM从原始序列中提取特征;第二通道将原始序列转化为化学分子式的形式,并使用SMILES简化化学分子式,将SMILES表示的序列输入至预训练的BERT模型,得到深度抽象特征;第三通道融合BPF、DPC、PAAC和K‑mer四种特征,共同提取原始序列不同层面的特征;拼接三个通道提取的特征,通过全连接层对输入的肽序列进行分类。本发明中ACP‑BC模型具有较强的稳健性和通用性,在预测ACP和非ACP方面具有巨大的潜力。
本发明授权一种抗癌肽识别方法及系统在权利要求书中公布了:1.一种抗癌肽识别方法,其特征在于,包括以下步骤: 步骤S1、对输入的肽序列进行数据增强,得到原始序列;所述肽序列进行数据增强的方式为替换、反转、局部随机混排和组合增强中的任意两种方式结合; 步骤S21、使用Bi-LSTM从原始序列中提取特征;原始序列首先通过融合在模型内部的Embedding层映射为256维的向量,再输入至Bi-LSTM进行提取特征; 步骤S22、将原始序列转化为化学分子式的形式,并使用SMILES简化化学分子式,将SMILES表示的序列输入至预训练的BERT模型,得到深度抽象特征; 步骤S23、融合BPF、DPC、PAAC和K-mer四种特征,共同提取原始序列不同层面的特征; 步骤S3、拼接经步骤S21、步骤S22和步骤S23提取的特征,通过全连接层对输入的肽序列进行分类; 所述BPF表示为: ; 式中,fp1为字母表中第一个氨基酸字母的编码,fp2为字母表中第二个氨基酸字母的编码,以此类推,fpk为字母表中第K个氨基酸字母的编码;其中,K表示肽P的N端长度,BPFk的维度为1*20; 所述DPC表示为: ; 式中,为400种二肽中a和b型氨基酸所代表的二肽,为a和b型氨基酸所代表的二肽的数目,N为肽的长度; 所述PAAC表示为: ; 式中,λ为用户设置的综合参数,推荐值为10;fi为蛋白质中每个氨基酸的频率;w为用户设置的权重因子,默认值为0.05;τk为第k层相关因子,反映所有第k个相邻残基之间的序列顺序相关性; 所述K-mer表示为: ; ; 假设一个肽序列的长度为L,则有种不同的可能K-mer,序列中出现步;将一个肽序列转化为K-mer稀疏矩阵M,将任意K个连续的氨基酸看作一个单元。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉林大学;通化师范学院,其通讯地址为:130000 吉林省长春市前进大街2699号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。