中国农业科学院农业基因组研究所孔思远获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国农业科学院农业基因组研究所申请的专利基于邻近连接Motif序列的Hi-C数据质量快速评估方法Motif-Hi-C及应用获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119920309B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510413063.8,技术领域涉及:G16B20/30;该发明授权基于邻近连接Motif序列的Hi-C数据质量快速评估方法Motif-Hi-C及应用是由孔思远;孔大帅;王宇辉;唐月婷设计研发完成,并于2025-04-03向国家知识产权局提交的专利申请。
本基于邻近连接Motif序列的Hi-C数据质量快速评估方法Motif-Hi-C及应用在说明书摘要公布了:本发明公开了一种基于邻近连接Motif序列的Hi‑C数据质量评估方法Motif‑Hi‑C,包括:S1:Hi‑C数据存储fastq文件进行Motif的匹配;S2:进行原始Hi‑C数据存储fastq文件分类:根据限制性内切酶的酶切位点和Motif特性,将原始Hi‑C数据存储fastq文件进行分类,分类为matched.fastq和unmatched.fastq文件;S3:unmatched.fastq文件数据的降噪处理:对unmatched.fastq文件数据执行比对、过滤和去重步骤后,得到降噪的unmatched.fastq文件数据及评估结果;S4:matched.fastq文件数据模拟去重;S5:Hi‑C数据质量评估:将步骤S3中经降噪处理的unmatched.fastq文件数据评估结果与模拟去重后的matched.fastq文件数据评估结果进行合并,并计算有效互作数与总读取对的比值,通过该比值来评估Hi‑C数据质量。该方法为高通量Hi‑C测序数据分析提供了新的思路和方案,可以大大提高Hi‑C数据分析效率。
本发明授权基于邻近连接Motif序列的Hi-C数据质量快速评估方法Motif-Hi-C及应用在权利要求书中公布了:1.基于邻近连接Motif序列的Hi-C数据质量评估方法Motif-Hi-C,其特征在于,所述方法包括如下步骤: S1:Hi-C数据存储fastq文件进行Motif的匹配:对于单酶切Hi-C数据存储fastq文件采用KMP算法进行Motif的匹配,对于多酶切Hi-C数据存储fastq文件采用AC自动机算法进行Motif的匹配; S2:进行原始Hi-C数据存储fastq文件分类:根据限制性内切酶的酶切位点和Motif特性,将原始Hi-C数据存储fastq文件进行分类,分类为matched.fastq和unmatched.fastq文件; S3:unmatched.fastq文件数据的降噪处理:对unmatched.fastq文件数据执行比对、过滤和去重步骤后,得到降噪的unmatched.fastq文件数据及评估结果; S4:matched.fastq文件数据模拟去重:根据unmatched.fastq文件数据去重情况计算PCR扩增去重倍数,然后利用unmatched.fastq文件数据计算获得的PCR扩增去重倍数对matched.fastq文件评估结果进行模拟PCR扩增去重; S5:Hi-C数据质量评估:将步骤S3中经降噪处理的unmatched.fastq文件数据评估结果与步骤S4中模拟去重后的matched.fastq文件数据评估结果进行合并,并计算有效互作数与总读取对的比值,通过该比值来评估Hi-C数据质量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国农业科学院农业基因组研究所,其通讯地址为:518000 广东省深圳市大鹏新区鹏飞路7号B5栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。