stringTie:转录本组装和定量工具 stringTie:转录本组装和定量⼯具 对于转录组数据⽽⾔,最基础的分析就是基因和转录本⽔平的定量了,定量就是确定⼀个基因或者转录本的表达量,其中定量的⽅式有很多种。最直接的⽅式就是统计mapping到这个基因/转录本上的reads的个数,将read
这个选项是可选的,但建议使用,因为StringTie可以利用一些比对/连接质量数据(连接周围的错配),在CRAM文件的情况下,如果同时提供参考基因组序列,可以更准确地评估。 --merge: 转录合并模式。与上述的组装使用模式不同,在合并模式下,StringTie将GTF/GFF文件的列表作为输入,并将这些转录本合并/组装成一个非冗余的转录本...
--merge 转录本合并模式。 在合并模式下,StringTie将所有样品的GTF/GFF文件列表作为输入,并将这些转录本合并/组装成非冗余的转录本集合。这种模式被用于新的差异分析流程中,用以生成一个跨多个RNA-Seq样品的全局的、统一的转录本。 如果提供了-G选项(参考注释基因组文件),则StringTie将从输入的GTF文件中将参考转录本...
这可以加快StringTie的组装分析的速度,特别是在排除线粒体基因组的情况下,在某些情况下,线粒体的基因可能具有非常高的覆盖率,但是它们对于特定的RNA-Seq分析可能不感兴趣的。 --merge 转录本合并模式。 在合并模式下,StringTie将所有样品的GTF/GFF文件列表作为输入,并将这些转录本合并/组装成非冗余的转录本集合。这...
⽤内存少。StringTie(http://ccb.jhu.edu/software/stringtie/)能够应⽤流神经⽹络算法和可选的de novo组装进 ⾏转录本组装并预计表达⽔平。与Cufflinks等程序相⽐,StringTie实现了更完整、更准确的基 因重建,并更好地预测了表达⽔平。Ballgown (https://github.com/alyssafrazee/ballgown)是R语⾔...
-B 选项一起运行,它将返回Ballgown输入文件,包含以下文件:(1) e2t.ctab, (2) e_data.ctab, (3) i2t.ctab, (4) i_data.ctab, and (5) t_data.ctab。如果StringTie使用 --merge 选项运行,它将多个GTF / GFF文件作为输入,并将这些转录本合并和组装成非冗余转录本集合。
$ stringtie --merge -p8-G genes.gtf -o merged.gtf mergelist.txt# expression level estimation$ stringtie –e –B -p8-G merged.gtf -o Sample.gtf Sample.sorted.bam# count data can be extracted from 'stringtie' output using 'prepDE.py',# and you can use them for DESeq/edgeR analysis...
("geneNames","geneIDs")])results_genes<-merge(results_genes,tmp,by.x=c("id"),by.y=c("geneIDs"),all.x=TRUE)# Sort from the smallest P value to largestresults_transcripts=arrange(results_transcripts,pval)results_genes=arrange(results_genes,pval)# Output as CSVwrite.csv(results_...
stringTie的用法就是这样咯。没什么好讲的 ~/biosoft/StringTie/current/stringtie --merge -p 8 -G ~/reference/gtf/gencode/gencode.v25lift37.annotation.gtf -o stringtie_merged.gtf mergelist.txt while read id do file=$(basename $id )