该分析流程主要根据2016年发表在Nature Protocols上的一篇名为Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown的文章撰写的,主要用到以下三个软件: 1. 软件介绍 1. HISAT (ccb.jhu.edu/software/hi)利用大量FM索引,以覆盖整个基因组,能够将RNA-Seq的读取与基因组进...
StringTie比Cufflinks预测了更多的转录本(50%-200%);IDP报告的外显子数在不同样本中都比较少,因为它...
接下来的具体步骤我也暂时看不明白具体是做啥了,反正最后得到的就是ballgown的输入文件了 代码语言:javascript 复制 stringtie -p 8 -l wT1 -G reference/TAIR10_GFF3_genes.gtf -o athaliana_wt_Rep1/transcripts.gtf wt_Rep1.sorted.bam stringtie -p 8 -l wT2 -G reference/TAIR10_GFF3_genes.gtf ...
$ stringtie –e –B -p 8 -G stringtie_merged.gtf -o ballgown/file1/file1.gtf file1.bam $ stringtie –e –B -p 8 -G stringtie_merged.gtf -o ballgown/file2/file2.gtf file2.bam 8. Ballgown差异表达分析: >library(ballgown) >library(RSkittleBrewer) >library(genefilter) >library(dp...
Ballgown根据实验条件,分析并统计基因、转录本的差异表达。技术细节Hisat2比对与Samtools处理:通过脚本将sam文件转换为bam文件,作为StringTie的输入。StringTie组装与预测新基因:使用StringTie组装转录组,生成gtf文件记录转录本信息,合并为单个gtf文件,与已知注释文件比较筛选新基因。筛选新基因:通过GTf文件...
Hisat2+stringtie+ballgown #加载module中的hisat2 module load RNAseq_hisat2 在下面操作开始前,需先进性mkdir文件的创建,输入和输出的文件前面都加上了文件的绝对路径,例如:/home/sisc/ref_genome/Bol_kaleZHn/ #建索引:hisat2-build hisat2-build /home/sisc/ref_genome/Bol_kaleZHn/Bol_kaleZHn.dna....
被称为表观转录组(epitranscriptome)的RNA修饰正成为基因调控的广泛调控机制。由于绘制转录组范围RNA修饰...
上游利用了hisat2进行比对(网上教程颇多,这里不再赘述),整个采用的是hisat2+StringTie+ballgown; 2.StringTie 差异分析应用,StringTie有两种模式,官方推荐和fast模式; StringTie--merge功能可生成在所有样本中均出现的非冗余转录本;输入文件是上一步生成的组装文件(GTF格式)和参考注释文件(我这里使用的是gencodeV29)...
HISAT2,StringTie,Ballgown处理转录组数据思路如下: 数据质控 将RNA-seq的测序reads使用hisat2比对 samtools将sam文件转成bam,并且排序,为下游分析做准备 stringtie对每个样本进行转录本组装 stringtie 将所有样本的转录本进行合并 注意:此处的mergelist.txt是自己创建的 ...
stringtie的输入BAM文件需要先进行sort samtools view -Su alns.sam ' samtools sort - alns.sorted stringtie alns.sorted.bam -b stringtie_input_dir -e -G hg19.annotation.gtf -C cov_ref.gtf -p 7 -o stringtie.out.gtf # -B This switch enables the output of Ballgown input table files (*.ct...