接下来就是ATAC-seq的数据分析了。 首先拿到fq文件之后,我们首先需要对其进行过滤: fastp -i fq1 -I fq2 -o out1 -O out2 -w 16 建议大家使用fastp的默认参数,因为ATAC-seq的片段长度只有50bp左右。因此很多公司给的clean data是150bp的话是不合理的,可能会导致很多信息被漏掉(这是我掉的坑)。 拿到过滤...
不好意思,这不存在的,因为ATAC-Seq只是找到了全基因组范围的开放区域,而这些开放区域的产生未必是转录因子引起,所以需要一些预测性工作。 数据分析实战 基本信息 以目前预发表在bioRxiv的文章“Chromatin accessibility changes between Arabidopsis stem cells and mesophyll cells illuminate cell type-specific transcription...
最近在编写全新的ATAC-seq流程,看到一个非常好的文献《From reads to insight: a hitchhiker’s guide to ATAC-seq data analysis》文献堪称是目前最全的ATAC-seq的pipeline教程,对比了很多软件,并给出了结论。笔者总结了一些关键点出来供大家共同学习 摘要 ATAC-seq广泛用于研究染色质生物学的研究,但是该实验得的...
ATAC-seq+RNA-seq: 一般来说,RNA-seq会优先于ATAC-seq先测,但是差异基因富集出来的基因通路只是一种相关性。想要分析出其中是谁调控了目的基因,就可以通过ATAC-seq来做motif分析,寻找潜在的调控因子,然后再进行后续的实验验证或者chip-seq的验证。 +HiC: 对于一些想了解染色质高级结构对生命行为的作用的时候,通常...
ATAC-seq data analysis: from FASTQ to peaks 基本概念: ATAC-seq和ChIP-seq鉴定出来的peak到底是一些什么区域?除了promotoer就是enhancer TSS enrichment和motif是两个不同的套路,TSS是特指启动区域,每个基因只有一个;另一个就是motif,这就是抓出TF,哪些TF在发挥作用 ...
ATAC-seq分析的第一步包括比对前QC,read比对到参考基因组,和比对后QC和处理(图2A)[32]。 比对前质量控制 比对前质量控制和read比对步骤是大多数高通量测序技术的标准配置。例如,FastQC [39]可用于在测序数据中可视化碱基质量得分、GC含量、序列长度分布、序列重复水平、k-mer过高以及引物和衔接子的污染。总体高的...
☝如果做了ATAC-seq可以不做ChIP-seq吗? ATAC-seq,全称Assay forTransposase-AccessibleChromatin with high throughput sequencing,是2013年由斯坦福大学William J. Greenleaf和Howard Y. Chang实验室开发的用来研究染色质可及性(通常也理解为染色质的开放性)的...
以上上游分析的步骤可以参考ATAC-seq data analysis: from FASTQ to peaks | Yiwei Niu’s Note。 接下来是常见的一些下游分析的方法。 IDR Peak 对于一个样本如果做了多个重复,就需要对样本的可重复性进行评估。可以用ENCODE项目的一个软件包Irreproducible Discovery Rate (IDR),导入两个样本的.narrowPeak结果文件...
ATAC-seq预分析 ATAC-seq分析的第一步是预分析,主要包括三个部分:1. 测序原始数据质控;2. 序列比对(Mapping);3. 比对后处理和质控。 01 测序原始数据质控 对ATAC-seq的测序原始数据质控和序列比对的流程与其它二代测序数据标准分析流程基本相同,比如可以选择FastQC...
ATAC-seq的数据分析主要是检测信号峰值,就是peaks,不同样品的peaks的差异主要是两个思路,使用韦恩图展现有无peaks的差异,另外就是使用散点图展现高低强弱的peaks差异。 现在是2021了,有了很多成熟的软件算法可以做peaks的差异分析,不过偶尔忆苦思甜也是有必要的ATAC-seq经典差异分析,让我们一起看看距离2013年的ATAC-se...