参考文献: Yan F, Powell DR, Curtis DJ, Wong NC. From reads to insight: a hitchhiker's guide to ATAC-seq data analysis. Genome Biol. 2020 Feb 3;21(1):22. doi: 10.1186/s13059-020-1929-3. PMID: 32014034; PMCID: PMC6996192.
接下来就是ATAC-seq的数据分析了。 首先拿到fq文件之后,我们首先需要对其进行过滤: fastp -i fq1 -I fq2 -o out1 -O out2 -w 16 建议大家使用fastp的默认参数,因为ATAC-seq的片段长度只有50bp左右。因此很多公司给的clean data是150bp的话是不合理的,可能会导致很多信息被漏掉(这是我掉的坑)。 拿到过滤...
不好意思,这不存在的,因为ATAC-Seq只是找到了全基因组范围的开放区域,而这些开放区域的产生未必是转录因子引起,所以需要一些预测性工作。 数据分析实战 基本信息 以目前预发表在bioRxiv的文章“Chromatin accessibility changes between Arabidopsis stem cells and mesophyll cells illuminate cell type-specific transcription...
最近在编写全新的ATAC-seq流程,看到一个非常好的文献《From reads to insight: a hitchhiker’s guide to ATAC-seq data analysis》文献堪称是目前最全的ATAC-seq的pipeline教程,对比了很多软件,并给出了结论。笔者总结了一些关键点出来供大家共同学习 摘要 ATAC-seq广泛用于研究染色质生物学的研究,但是该实验得的...
ATAC-seq data analysis: from FASTQ to peaks 基本概念: ATAC-seq和ChIP-seq鉴定出来的peak到底是一些什么区域?除了promotoer就是enhancer TSS enrichment和motif是两个不同的套路,TSS是特指启动区域,每个基因只有一个;另一个就是motif,这就是抓出TF,哪些TF在发挥作用 ...
ATAC-seq分析的第一步包括比对前QC,read比对到参考基因组,和比对后QC和处理(图2A)[32]。 比对前质量控制 比对前质量控制和read比对步骤是大多数高通量测序技术的标准配置。例如,FastQC [39]可用于在测序数据中可视化碱基质量得分、GC含量、序列长度分布、序列重复水平、k-mer过高以及引物和衔接子的污染。总体高的...
ATAC-seq的数据分析主要是检测信号峰值,就是peaks,不同样品的peaks的差异主要是两个思路,使用韦恩图展现有无peaks的差异,另外就是使用散点图展现高低强弱的peaks差异。 现在是2021了,有了很多成熟的软件算法可以做peaks的差异分析,不过偶尔忆苦思甜也是有必要的ATAC-seq经典差异分析,让我们一起看看距离2013年的ATAC-se...
ATAC-seq预分析 ATAC-seq分析的第一步是预分析,主要包括三个部分:1. 测序原始数据质控;2. 序列比对(Mapping);3. 比对后处理和质控。 01 测序原始数据质控 对ATAC-seq的测序原始数据质控和序列比对的流程与其它二代测序数据标准分析流程基本相同,比如可以选择FastQC...
git clone https://github.com/yuanj82/NGS-analysis.gitcd NGS-analysis/environmentcp .condarc ~/conda env create --file atac-seq-env.yml # ATAC-seq 创建完成后激活环境就可以使用了: conda activate atac-seq 数据获取与预处理 从NCBI SRA 数据库下载 SRR_Acc_List.txt 文件: 后面的分析都可以基于...
☝如果做了ATAC-seq可以不做ChIP-seq吗? ATAC-seq,全称Assay forTransposase-AccessibleChromatin with high throughput sequencing,是2013年由斯坦福大学William J. Greenleaf和Howard Y. Chang实验室开发的用来研究染色质可及性(通常也理解为染色质的开放性)的...