Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 湖南大学蔡明杰获国家专利权

湖南大学蔡明杰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉湖南大学申请的专利一种结合信息粒融合和证据推理的蛋白质聚类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115512771B

龙图腾网通过国家知识产权局官网在2025-12-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211190889.5,技术领域涉及:G16B40/00;该发明授权一种结合信息粒融合和证据推理的蛋白质聚类方法是由蔡明杰;吴芷珊;许峰;高路;蔡婉亭设计研发完成,并于2022-09-28向国家知识产权局提交的专利申请。

一种结合信息粒融合和证据推理的蛋白质聚类方法在说明书摘要公布了:本发明提供一种结合信息粒融合和证据推理的蛋白质聚类方法,通过将细胞中的蛋白质序列数据的信息粒化,基于相交关系进行蛋白质序列数据的信息粒融合,基于密度传播进行蛋白质序列数据的粒簇融合,基于距离进行蛋白质序列数据的粒群融合,计算稳定样本的证据值,计算不稳定样本的证据值,根据证据值分配蛋白质序列样本所属类别,提高蛋白质亚细胞定位预测的准确度,从而便于生物信息学家对各亚细胞结构中的特定蛋白质进行判断或设计、或对蛋白质的功能进行预测。

本发明授权一种结合信息粒融合和证据推理的蛋白质聚类方法在权利要求书中公布了:1.一种结合信息粒融合和证据推理的蛋白质聚类方法,其特征在于,包括: 步骤1:将细胞中的蛋白质序列数据的信息粒化,根据预设参数k,基于各蛋白质序列样本的稀疏度sdxi,对蛋白质序列数据集U进行信息粒化,生成一组g个信息粒{G1,G2,...,Gg}; 其中,蛋白质序列数据集U={x1,x2,...,xn}由n个蛋白质序列样本组成,每个蛋白质序列样本xi包含w个属性信息{xi1,xi2,...,xiw}; k取值为表示非整数的向上取整,c为给定的簇数,一个簇表示一个亚细胞结构种类,簇数表示亚细胞结构种类数量; 各蛋白质序列样本的稀疏度是同时度量蛋白质序列样本的全局密度和局部密度的信息粒度,其中,为使蛋白质序列样本的相对密度最大的邻域半径,度量蛋白质序列样本全局密度,为各蛋白质序列样本在不同邻域半径下的相对密度,|·|表示集合的基数,各蛋白质序列样本在不同邻域半径下的邻域δxi,dij={xz|xz∈U,dxi,xz≤dij},蛋白质序列样本xi和xj之间的欧氏距离dxi,xj=dij=||xi-xj||2,i,j=1,2,...,n且i≠j,为蛋白质序列样本的k近邻半径,度量蛋白质序列样本局部密度,表示蛋白质序列样本xi的第k个近邻; 对于每个信息粒G,存在蛋白质序列样本xi,使得且|G|=k,并且,即信息粒G是一个以xi为中心、为半径的超球,内含有k个蛋白质序列样本,且中心xi的稀疏度是最小的; 步骤2:基于相交关系进行蛋白质序列数据的信息粒融合,若任意两个信息粒相交|Gi∩Gj|≥1,即两个信息粒存在共同的蛋白质序列样本,则融合这两个信息粒,每一对信息粒融合完毕后,一组信息粒{G1,G2,...,Gg}转化成一组g*个粒簇 步骤3:基于密度传播进行蛋白质序列数据的粒簇融合,针对任一个粒簇GCa以及与其距离最近的粒簇GCb,若sd*GCa≥sd*GCb,即GCb的密度大于GCa的密度,则融合这两个粒簇,每个粒簇均融合完毕后,一组粒簇转化成一组g′个粒群{GF1,GF2,...,GFg′}; 其中,任意两个粒簇之间的距离d*GCa,GCb=min{dij|xi∈GCa,xj∈GCb},即两个粒簇中相距最近的一对蛋白质序列样本之间的距离作为粒簇之间距离,其中a,b=1,...,g*且a≠b,粒簇的稀疏度即粒簇内蛋白质序列样本的稀疏度的平均值代表粒簇的密度; 步骤4:基于距离进行蛋白质序列数据的粒群融合,对于给定的簇数c,如果c=g′或c=g*则执行步骤4.1,如果c<g′则执行步骤4.2,如果c>g′则执行步骤4.3; 其中,任意两个粒群的距离d*GFa,GFb=min{dij|xi∈GFa,xj∈GFb},即两个粒群中相距最近的一对蛋白质序列样本之间的距离作为粒群的距离; 步骤4.1:将g′个粒群{GF1,GF2,...,GFg′}或者g*个粒簇直接作为初始簇{Cl1,Cl2,...,Clc}; 步骤4.2:将距离最近的一对粒群融合,更新粒群数量和粒群的距离,再次执行步骤4; 步骤4.3:将每个粒群视为一个子数据集,针对每个子数据集再次执行步骤1至步骤3,得到的所有粒群组合成新的一组粒群,其中所有未加入粒群的蛋白质序列样本被视为一个粒群,再次执行步骤4; 步骤5:计算稳定样本的证据值,将初始簇Ω={Cl1,Cl2,...,Clc}内的蛋白质序列样本作为稳定样本,计算稳定样本属于各单簇和簇全集的证据值其中u=1,2,...,c,A∈2Ω\{Cl1,Cl2,...,Clc,Ω},初始化集合S,将所有稳定样本加入集合S; 步骤6:计算不稳定样本的证据值,对于不属于集合S的稀疏度最小的蛋白质序列样本xi,根据集合S中蛋白质序列样本xj计算xi属于各单簇和簇全集的证据值:其中表示xi在集合S中的k近邻,利用Dempster合并规则公式将k个近邻提供的所有证据值合并其中“·”为任意的Clu或Ω,将xi加入集合S,重复执行步骤6直到S=U; 步骤7:根据证据值分配蛋白质序列样本类别,对于每一个蛋白质序列样本xi,将其分配至簇最终得到的各簇为聚类结果,如果对于给定的离群点阈值τ,则xi为离群样本。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南大学,其通讯地址为:410082 湖南省长沙市岳麓区麓山南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。