哈尔滨工业大学姜涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于图压缩的个体基因组模拟数据生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119785871B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411973780.8,技术领域涉及:G16B5/00;该发明授权一种基于图压缩的个体基因组模拟数据生成方法是由姜涛;于宏扬;刘亚东设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种基于图压缩的个体基因组模拟数据生成方法在说明书摘要公布了:本发明属于生物信息学领域,尤其涉及一种基于图压缩的个体基因组模拟数据生成方法。本发明目的是解决现有的个体基因组仿真数据用于预测药物对不同个体的疗效时精准性低的问题。提供了一种基于图压缩的个体基因组模拟数据生成方法,包括:S1:获取历史基因组数据集;S2:对历史基因组数据集中的图基因组数据进行预处理,得到预处理后的图基因组数据;S3:计算预处理后的图基因组数据中节点的联通度,根据节点的联通度对预处理后的图基因组数据进行前向压缩处理,得到前向压缩后的图基因组数据;S4:根据前向压缩后的图基因组数据生成个体基因组模拟数据。解决了现有的个体基因组仿真数据用于预测药物对不同个体的疗效时精准性低的问题。
本发明授权一种基于图压缩的个体基因组模拟数据生成方法在权利要求书中公布了:1.一种基于图压缩的个体基因组模拟数据生成方法,其特征在于,包括: S1:获取历史基因组数据集; 所述历史基因组数据集中的基因组数据为图基因组数据; 所述图基因组包括:节点集合、边集合以及图; 所述节点表示基因组中的序列片段; 所述边表示节点之间的连接关系; 所述图表示节点和边组成的整体结构; S2:对历史基因组数据集中的图基因组数据进行预处理,得到预处理后的图基因组数据; S3:计算预处理后的图基因组数据中节点的联通度,根据节点的联通度对预处理后的图基因组数据进行前向压缩处理,得到前向压缩后的图基因组数据;具体过程为: S3.1:计算预处理后的图基因组中所有节点的联通度; 所述节点的联通度是节点具有父节点和子节点数量的总和; 所述节点的父节点为节点前向连接的节点,所述节点的子节点为节点后向连接的节点; S3.2:根据所有节点的联通度确定的预处理后的图基因组中第一类子节点,所有的第一类子节点组成第一类子节点集合; 所述第一类子节点为只有一个父节点的节点,所述第一类子节点的父节点称为第一类父节点,所有的第一类父节点组成第一类父节点集合; S3.3:用第一类父节点继承对应的第一类子节点的连接信息;得到继承后的第一类父节点,用公式表示为: ifvc具有唯一的vp 式中,B表示后向连接信息;vc表示第一类子节点,vp表示第一类父节点,表示继承后的第一类父节点; S3.4:将预处理后的图基因组中第一类子节点进行剔除,同时对应的继承后的第一类父节点创建合并节点集合;得到剔除后的图基因组; 其中,第i个继承后的第一类父节点创建的合并节点集合表示为 所述合并节点集合记录被剔除的第一类子节点的继承信息; S3.5:计算剔除后的图基因组所有节点的联通度,根据所有节点的联通度判断剔除后的图基因组是否所有节点均没有唯一的父节点, 若剔除后的图基因组所有节点均没有唯一的父节点时,则得到前向压缩后的图基因组数据; 当剔除后的图基因组存在任何一个节点具有唯一的父节点时,返回S3.2; S4:根据前向压缩后的图基因组数据生成个体基因组模拟数据;具体过程为: S4.1:将前向压缩后的图基因组中每个继承后的第一类父节点对应的合并的子节点集,在预处理后的图基因组中进行标注;得到标注后的预处理后的图基因组; 其中,继承后的第一类父节点在预处理后的图基因组中对应的节点称为第二类父节点; S4.2:根据标注后的预处理后的图基因组,构建以第二类父节点为首节点,n个终止节点为末节点的子图基因组;n为正整数; 在前向压缩后的图基因组中每一个继承后的父节点均代表了一个子图基因组; 其中,第i个继承后的第一类父节点代表的子图基因组表示为 S4.3:在前向压缩后的图基因组中选择起始节点对应的继承后的第一类父节点以及终止节点对应的继承后的第一类父节点根据继承后的第一类父节点和继承后的第一类父节点对在前向压缩后的图基因组进行纵深搜索,得到个体基因组压缩路径;具体过程为: S4.3.1:使用位运算存储节点定义前向压缩后的图基因组中每个继承后的第一类父节点的访问状态, S4.3.2:选择起始节点在前向压缩后的图基因组中对应的继承后的第一类父节点 选择终止节点在前向压缩后的图基因组中对应的继承后的第一类父节点 根据前向压缩后的图基因组中每个继承后的第一类父节点的访问状态,在前向压缩后的图基因组进行纵深搜索,得到一条个体基因组压缩路径; 所述个体基因组压缩路径包括m个继承后的第一类父节点,m为正整数; 其中个体基因组压缩路径的起点表示为个体基因组压缩路径的终点表示为 S4.4:将S4.3得到的个体压缩基因组路径进行解压缩,得到个体基因组路径;对个体基因组路径进行碱基化处理,得到标准的FASTA文件格式的个体基因组结构数据,作为个体基因组模拟数据;具体过程为: S4.4.1:将S4.3得到的个体压缩基因组路径中m个继承后的第一类父节点转换为m个个体基因组子路径; 其中,第i个继承后的第一类父节点对应的个体基因组子路径表示为Pi;具体过程为: S4.4.1.1:选择第j个继承后的第一类父节点和第j+1个继承后的第一类父节点 S4.4.1.2:根据j+1个继承后的第一类父节点在标注后的预处理后的图基因组中对应的第二类父节点vpj+1,确定第j个个体基因组子路径Pj的终点; S4.4.1.3:根据第j个个体基因组子路径Pj的终点得到第j个个体基因组子路径Pj; S4.4.2:将m个个体基因组子路径合并,得到个体基因组路径; S4.4.3:对个体基因组路径进行碱基化处理,得到标准的FASTA文件格式的个体基因组结构数据,作为个体基因组模拟数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。