(一)HISAT2 序列比对 1.1 结果文件解读 1.2 序列比对 1.3 结果文件解读 1.4 格式转换并排序 (二)StringTie 转录本组装 2.1 输入文件 2.2 命令行格式及命令选项 2.3 结果文件解读 2.4 合并得到非冗余转录本(可选) (三)准备差异表达分析文件 (四)DESeq2 分析差异表达基因 RNA- seq 的数据处理主要分为以下几个...
unzip hisat2-2.1.0-Linux_x86_64.zip echo'export PATH=~/RNA-Seqruanjian/hisat2-2.1.0/bin:$PATH'>>~/.bashrc 2、StringTie 将比对好的reads进行拼装并预计表达水平 wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-2.0.4.Linux_x86_64.tar.gz tar-zvxf stringtie-2.0.4.Linux_x86_64.t...
文章里是以前的分析记录,现在看来参考意义不大,目前常有的RNA-Seq分析流程是: hisat2比对,stringtie提取表达量信息和基因区reads数,Deseq2分析显著差异表达基因;详细的流程网上有很多,我这里就不赘述了,有个要注意的就是,显著差异表达基因分析时注意排除低reads分布的基因,一般是处理前后reads数总和大于10,当然还可...
hisat2 -p 2 --dta -x ~/RNASEQ/index/grch38_tran/genome_tran -U ~/ribosome/GSE69923/SRR${i}.rmadapt.fq -S SRR${i}.sam; samtools sort -@ 2 -o SRR${i}.bam SRR${i}.sam; samtools index -@ 2 SRR${i}.bam stringtie -p 2 -G ~/RNASEQ/index/grch38_tran/Homo_sapiens.GRC...
文献阅读【RNA-seq数据归一化】 最近一直在做lncRNA的分析,其中的lncRNA的差异表达分析中,需要对reads count 进行归一化,之前没有考虑很多,就用的通常的流程: hisat2→stringtie→prepDE.py/featureCount→DESeq2 其中的DESeq2 的归一化部分,也是我们通常称的标准化,是我们关注的重点,DESeq2主要原理:通过计算一...
使用TPM/FPKM/RPKM进行差异分析真的可以消除系统误差吗?RNA-seq : Hisat2+Stringtie+DESeq2 后面我们会介绍使用gffcompare发现新转录本的流程,这里我们仍走这个流程,但只对已知转录本定量 可以发现如果直接基于bam文件定量,给到的-G参数就是一开始的参考基因组gtf文件,而不是需要多走一步组装后merge的gtf文件 ...
数据处理流程也是在不断更新的,例如我们现在使用的hisat2-stringtie-DESeq2,就取代了原来的tophat+...
⑵Hisat2比对(新建文件夹result_data,将RNA-seq的测序reads使用hisat2比对) (3)Mapping结果(HISAT2) 7使用samtools转化文件格式 samtools将sam文件转成bam文件,并且排序,为下游分析做准备 8使用StringTie组装定量 ⑴stringtie评估表达量(计算表达量并且为DEseq2...
StringTie主要是用于 RNA-seq 的转录本组装和定量分析软件,包括下面两个主要功能:转录本组装和定量。 StringTie还有一个优势是运行速度很快,Stringtie通过使用基因组指导的组装的方法与从头组装的概念结合的方法来改善转录组组装。 现在转录组比较流行的数据分析流程:HISAT2 +StringTie+ Ballgown/edgeR/DEseq2 ...
RNA测序分析有万般套路,比如tophat+cuffLinks,star+htseq+deseq2,hisat2+stringtie等等,但是对于这些组合得到的结果哪个更可靠,恐怕我们没有足够的精力和技术去深入研究。但是在今年七月份,一群美国人在Nature Communications上发表一篇足够有分量的文章,在精确度、效率和一致性三个层次上评估了当前主流的39个工具的120...