选项-B,-b,-e,-C需要此选项(详情如下)-l<label>#将<label>设置为输出转录本名称的前缀。默认:STRG-A<gene_abund.tab>#输出基因丰度的文件(制表符分隔格式)-C<cov_refs.gtf>#输出所有转录本对应的reads覆盖度的文件,此处的转录本是指参考注释基因文件中提供的转录本。(需要参数-G).-B#应用该选项,则
StringTie是由约翰霍普金斯大学Steven L. Salzberg教授领导的团队开发的,用于组装和量化RNA-Seq数据的分析工具。自2015年首次发布以来,StringTie凭借其高效、准确的特点,已成为转录组学研究中不可或缺的工具之一。 功能特点 高效的转录本组装:StringTie 具备强大的组装能力,能够从复杂的 RNA - Seq 数据中准确地重建转录...
stringtie-p10\-Ghg19.gtf \-o output.gtf \-b ballgown_out_dir-e \ align.sorted.bam -G参数指定参考基因组的gtf文件,-o指定输出的文件,格式也为gtf,-b指定ballgown的输出结果目录,这个参数是为了方便下游进行ballgown差异分析,-e参数要求软件只输出已知转录本的定量结果。 在输出的GTF格式的文件中,对于每...
而因为有参考基因组,那么不在原基因组中的文转录本就将被视为新转录本。 表达估计模式(-e) 当使用-e选项时,参考注释文件-G是一个必要的输入,StringTie不会尝试组装输入的读排列,而是只估计-G文件中提供的 "参考 "转录本的表达水平(没有新的转录本产生)。并且,任何与参考转录本重叠的reads比对信息将被忽略。
多个样本分析: # stringtie.sh for i in A B C D E; do stringtie -p 8 -G sample.annotation.gtf -o $i.gtf ${i}_sorted.bam done 参考资料: 1.http://ccb.jhu.edu/software/stringtie/index.shtml 2.https://github.com/gpertea/stringtie...
-G参数指定参考基因组的gtf文件,-o指定输出的文件,格式也为gtf, -b指定ballgown的输出结果目录,这个参数是为了方便下游进行ballgown差异分析,-e参数要求软件只输出已知转录本的定量结果。
其中是输入的bam格式数据文件,options是可选参数。可选参数包括-h或--help(显示帮助信息)、-v(打开详细模式,打印程序处理的详细信息)、-o[<path>]<>(设置StringTie组装转录本的输出GTF文件的路径和文件名,可指定完整路径)和-p<int>(指定组装转录本的线程数)。 4.结果分析:StringTie将组装得到的转录本以GTF...
我们需要用到samtools,如果没有的话,需要先安装: 使用的时候记得激活一下环境。 我们先了解一下获得的sam数据,使用代码查看文件: 接下来等待结果即可! 格式转化成功后就可以进行下一步分析了! 小果今天就分享到这里,下期不见不散! 欢迎使用:云生信 - 学生物信息学 (biocloudservice.com) ...
覆盖度是转录本定量中的一个重要参数,因为它能够反映转录本在样本中的实际存在情况。 四、StringTie如何进行基因表达定量 StringTie通过以下步骤进行基因表达定量: 输入处理: 接收经过比对和排序的RNA-Seq读段(如BAM文件)作为输入。 可选地接收参考基因组注释文件(如GTF/GFF文件)以指导组装过程。 转录本组装: 利用...
参数说明: -e 限制reads比对的处理,仅估计和输出与用-G选项给出的参考转录本匹配的组装转录本。使用该选项,则会跳过处理与参考转录本不匹配的组装转录本,这将大大的提升了处理速度。 -B 应用该选项,则会输出Ballgown输入表文件(* .ctab),其中包含用-G选项给出的参考转录本的覆盖率数据。(有关这些文件的说明...