海南大学夏志强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉海南大学申请的专利一种基于最小熵算法的基因表达网络分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116884487B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310912377.3,技术领域涉及:G16B25/00;该发明授权一种基于最小熵算法的基因表达网络分析方法是由夏志强;江思容;邹枚伶设计研发完成,并于2023-07-24向国家知识产权局提交的专利申请。
本一种基于最小熵算法的基因表达网络分析方法在说明书摘要公布了:本发明提供一种基于最小熵算法的基因表达网络分析方法,包括以下步骤:数据收集及预处理;基因间相关性获取;转换数据格式;基于基因相关性矩阵建立基因表达网络;使用Infomap多级网络聚类模型对基因表达网络进行聚类,利用随机游走的方式识别所有基因之间的关系,将同信息编码的基因划分为同一个群组,并对得到的每一个群组进行网络可视化。本申请基于最小熵算法选择相关性强的基因来构建基因表达网络,解决以往技术无法直接从计算过程中选择相关性强的基因去绘制表达网络的问题,并基于评估最小熵算法每个基因对于聚类任务的重要性,并选择最具代表性的基因作为聚类特征,提升聚类结果的准确性。
本发明授权一种基于最小熵算法的基因表达网络分析方法在权利要求书中公布了:1.一种基于最小熵算法的基因表达网络分析方法,其特征在于,所述方法包括以下步骤: S1.数据收集及预处理:收集各类RNA测序数据,进行预处理,并绘制样本相关性矩阵,去除离群样本,具体为: 1收集需要聚类的RNA测序数据集,所述数据集包含N个样本,每个样本由d个属性组成,可以表示为一个Nxd的矩阵,将所有样本表示为一个矩阵,矩阵的每一行表示一个样本向量; 2计算每个样本之间的距离:通过计算每个样本与其他样本之间的欧式距离,得到一个NxN的距离矩阵;对于两个d维样本向量X和Y,所述欧式距离dX,Y为: dX,Y=sqrtx1-y1^2+x2-y2^2+...+xd-yd^2 其中,x1、x2、...、xd和y1、y2、...、yd分别是向量X和向量Y在每个维度上的取值; 3选择簇的数量k,然后使用k-means算法将样本聚类成k个簇; 4观察是否有离群值或异常值,包括去除无效数据、标准化处理、选择特征基因,并绘制样本相关性矩阵; S2.基因间相关性获取:使用Pearson相关系数,计算所有基因间的相关性,构建基因相关性矩阵;其中,所述Pearson相关系数在统计学中,是用于度量两个变量X和Y之间的相关线性相关,Pearson相关系数的值范围在-1和1之间,值越接近于1或-1表示相关性越强,值越接近于0表示相关性越弱或不存在; S3.转换数据格式:基于字段fromNode、toNode、weight,将基因相关性矩阵转换成DataFrame格式,并对字段fromNode、toNode进行标签编码; S4.基于基因相关性矩阵建立基因表达网络:采用最小熵算法进行聚类分析,并构建出基因表达网络,具体步骤为: 1选定熵函数、距离度量的相应参数; 2最小化样本间的信息熵; 3将数据点分成不同的簇; 4构建出基因表达网络,在基因表达网络中,每个基因可以表示为节点,基因间的相关性可以表示为边; S5.使用Infomap多级网络聚类模型对基因表达网络进行聚类,利用随机游走的方式识别所有基因之间的关系,将同信息编码的基因划分为同一个社区,并对得到的每一个社区进行网络可视化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人海南大学,其通讯地址为:570228 海南省海口市美兰区人民大道58号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。