一、DESeq2、edgeR、limma的使用 强烈建议查看官方说明书进行这三种差异分析的学习,链接在文章末尾给出。 注意,这三个包都需要输入counts进行分析,不能用tpm、fpkm等归一化后的数据。 承接上节RNA-seq入门实战(三):在R里面整理表达量counts矩阵和RNA-seq入门实战(二):上游数据的比对计数——Hisat2+ featureCounts...
基因富集分析(Gene Enrichment Analysis)是一种常用的生物信息学方法,用于解释在基因组或基因集合中出现的显著富集的功能或特定特征。这种分析用于高通量基因表达数据的解释,比如基因芯片数据或RNA测序数据。 基本原理是将感兴趣的基因集与参考基因组或已知的基因功能注释进行比较。这个过程涉及到统计分析,用于确定是否某个...
找到Supplementary file 下的SRA Run Select选项 Common Fields下介绍了数据的基本信息,例如表中的PAIRED表示双端测序数据。此次实战选择勾选 Found 27 Items下的RNA_mESCs和RNA_EpiSCs各两个数据,再选中Select下的Selected选项,下载Accession List后复制数据的SRR号 二、SRA数据下载 1.创建并进入test项目文件夹,将SRR...
RNA-seq入门实战(一):上游数据下载、格式转化和质控清洗 RNA-seq入门实战(二):上游数据的比对计数——Hisat2+ featureCounts 与 Salmon RNA-seq入门实战(三):从featureCounts与Salmon输出文件获取counts矩阵 RNA-seq入门实战(四):差异分析前的准备——数据检查 RNA-seq入门实战(五):差异分析——DESeq2 edgeR limma...
RNA-seq入门实战整体分析流程 本节概览: 1.在文章中找到 GEO accession number, 从NCBI获取数据SRR号 2.在linux中使用prefetch命令根据SRR号下载SRA文件 3.使用fasterq-dump/fastq-dump命令将SRA文件转为FASTQ格式,pigz软件多线程压缩(可选) 4.使用fastqc和multiqc进行测序数据的质控查看 ...
承接上节RNA-seq入门实战(二):上游数据的比对计数——Hisat2与Salmon 之前已经得到了featureCounts与Salmon输出文件(counts、salmon)和基因ID转化文件(g2s_vm25_gencode.txt、t2s_vm25_gencode.txt)。一般为了对样品进行分组注释我们还需要在GEO网站下载样品Metadata信息表SraRunTable.txt,接下来就需要在R中对输出...
承接上节:RNA-seq入门实战(四):差异分析前的准备——数据检查,以及RNA-seq入门实战(五):差异分析——DESeq2 edgeR limma的使用与比较 本节概览: 1.GSVA简单介绍 2.基因集的下载读取: 手动与msigdbr包下载 3.GSVA的运行 4.limma差异分析 5.GSVA结果可视化:热图、火山图、发散条形图/柱形偏差图 ...
作者注:虽然是实战,其实只能称得上学习笔记而已,初学过程中参考了大量博客和帖子,还有大神引用的大牛的帖子,参考列表见最后。 1、软件安装 1.1 硬件系统情况 系统:BioLinux8(ubuntu14.04.2-x64) 吐槽个一下这个系统,普通帐户竟然环境变量错误(source ~/.bashrc),对我等小白来说实在头大,只有用root用户运行了。
承接上节:RNA-seq入门实战(四):差异分析前的准备——数据检查,以及RNA-seq入门实战(五):差异分析——DESeq2 edgeR limma的使用与比较 我们《生信技能树》这些年有很多关于WGCNA的实战细节建议分享,见: 一文学会WGCNA分析 一文看懂WGCNA 分析(2019更新版)(点击阅读原文即可拿到测序数据) ...
10. 全面而详细!RNA-seq 数据分析最佳实战 一篇RNA-seq分析流程的综述,全面而详细!深度好文,可用来反复阅读。初学者用于把握RNA-seq真个流程及各个流程选择上的差异。已经开始学习者可用来查缺补漏和发现新的分析角度。 A survey of best practices for RNA-seq data analysis ...