-s <intorstring>:链特异性参数。应提供单个整数值(应用于所有输入文件)或逗号分隔的值字符串(应用于每个对应的输入文件)。可能的值包括:0(un-stranded,默认值)、1(stranded)和2(reversely stranded)。 对于paired-end reads,第一次读取的链被视为整个片段的链。FLAG字段用于判断read是一对中的first read还是...
-t 指定feature的类型,默认是exon,当然gtf里面还有gene、CDS或者直接以feature命名的分类方式。 其它参数: -f参数该参数设置后统计的是feature层面(默认是exon)的参数,如果不设置则是直接统计meta-feature参数(即一个gene中的多个exon) 这时按exon分类进行统计,但是由于没有设置-f,在同一个gene内的exon会被统计成一...
一旦输入参数设置和数据准备工作完成,就可以通过运行FeatureCounts命令来进行基因表达计数分析。在运行命令时,需要指定输入的测序数据文件、参考基因组文件和相应的参数设置,并选择输出结果的文件格式和路径。通过运行命令,FeatureCounts将对测序数据进行基因表达计数,并输出相应的结果文件。 4. 结果解读 对于FeatureCounts的结果...
一般而言,RNA-seq得到原始counts表达矩阵最常用到的上游软件就是featureCounts和Salmon了,在这两类软件的输出结果中,除了基因(或转录本)的counts信息外,也包含了基因有效长度信息,如featureCounts输出文件的Length这一列对应的就是基因有效长度。获取基因有效长度的最简便方法是直接从featureCounts或salmon的输出文件中提取。
承接上节RNA-seq入门实战(一)本节介绍使用hisat2或salmon这两种方法进行转录组上游数据的比对和计数。39个转录组分析工具,120种组合评估(https://www.nature.com/articles/s41467-017-00050-4) 表明基于hisat2或salmon进行转录本定量都比较优秀。 [Gaining comprehensive biological insight into the transcriptome by...
featureCounts的参数有点多,可用-h先查看下 ~/biosoft/subread/subread-1.6.0-Linux-x86_64/bin/featureCounts -h 按照官网教程简单使用下: ~/biosoft/subread/subread-1.6.0-Linux-x86_64/bin/featureCounts -T 6 -p -t exon -g gene_id -a ~/annotation/mm10/gencode.vM13.annotation.gtf -o SRR35899...
在实际计算中,featureCounts还提供了多种参数设置,以处理不同情况下的计数问题。比如,可以设置是否只计数唯一比对上的read,或者如何处理reads跨越了多个特征的情况等。 综上所述,featureCounts通过精确的序列比对和智能的计数分配策略,为RNA测序数据中的基因表达定量提供了可靠的方法。正确理解其计算过程,对于后续的数据分析...
-a参数指定的区间注释文件,默认是gtf格式;-T参数指定线程数,默认是1;-t参数指定想要统计的feature的名称,取值范围是gtf 文件中的第3列的值,默认是exon;-g参数 指定想要统计的meta-feature的名称,取值范围参考gtf第9列注释信息,gtf的第9列为key=value的格式,-g参数可能的取值就是所有的key, 默认值是gene_id。
主要参数包括:-a用于指定注释文件,-o指定结果输出目录及文件名,-p在paired-end情况下使用,统计fragment而非read,-t指定feature类型,默认为exon,可选择其他如gene、CDS或自定义分类。其他参数包括-f参数,设置后统计的是feature层面(默认为exon),未设置则直接统计Metafeature参数,即一个基因中的...