-s <intorstring>:链特异性参数。应提供单个整数值(应用于所有输入文件)或逗号分隔的值字符串(应用于每个对应的输入文件)。可能的值包括:0(un-stranded,默认值)、1(stranded)和2(reversely stranded)。 对于paired-end reads,第一次读取的链被视为整个片段的链。FLAG字段用于判断read是一对中的first read还是...
一旦输入参数设置和数据准备工作完成,就可以通过运行FeatureCounts命令来进行基因表达计数分析。在运行命令时,需要指定输入的测序数据文件、参考基因组文件和相应的参数设置,并选择输出结果的文件格式和路径。通过运行命令,FeatureCounts将对测序数据进行基因表达计数,并输出相应的结果文件。 4. 结果解读 对于FeatureCounts的结果...
-t 指定feature的类型,默认是exon,当然gtf里面还有gene、CDS或者直接以feature命名的分类方式。 其它参数: -f参数该参数设置后统计的是feature层面(默认是exon)的参数,如果不设置则是直接统计meta-feature参数(即一个gene中的多个exon) 这时按exon分类进行统计,但是由于没有设置-f,在同一个gene内的exon会被统计成一...
一般而言,RNA-seq得到原始counts表达矩阵最常用到的上游软件就是featureCounts和Salmon了,在这两类软件的输出结果中,除了基因(或转录本)的counts信息外,也包含了基因有效长度信息,如featureCounts输出文件的Length这一列对应的就是基因有效长度。获取基因有效长度的最简便方法是直接从featureCounts或salmon的输出文件中提取。
承接上节RNA-seq入门实战(一)本节介绍使用hisat2或salmon这两种方法进行转录组上游数据的比对和计数。39个转录组分析工具,120种组合评估(https://www.nature.com/articles/s41467-017-00050-4) 表明基于hisat2或salmon进行转录本定量都比较优秀。 [Gaining comprehensive biological insight into the transcriptome by...
参数说明 input file 输入的bam/sam文件,支持多个文件输入 -a < string > 参考gtf文件名,支持Gzipped文件格式 -F 参考文件的格式,一般为GTF/SAF,C语言版本默认的格式为GTF格式 -A 提供一个逗号分割为两列的文件,一列为gtf中的染色体名,另一列为read中对应的染色体名,用于将gtf和read中的名称进行统一匹配,注...
featureCounts的参数有点多,可用-h先查看下 ~/biosoft/subread/subread-1.6.0-Linux-x86_64/bin/featureCounts -h 按照官网教程简单使用下: ~/biosoft/subread/subread-1.6.0-Linux-x86_64/bin/featureCounts -T 6 -p -t exon -g gene_id -a ~/annotation/mm10/gencode.vM13.annotation.gtf -o SRR35899...
主要参数包括:-a用于指定注释文件,-o指定结果输出目录及文件名,-p在paired-end情况下使用,统计fragment而非read,-t指定feature类型,默认为exon,可选择其他如gene、CDS或自定义分类。其他参数包括-f参数,设置后统计的是feature层面(默认为exon),未设置则直接统计Metafeature参数,即一个基因中的...
htseq-count -f bam -r pos -a 10 -t exon -s no -i gene_id -m union ${i}/${i}.Aligned.sortedByCoord.out.bam assembeCompare2Ref.annotated.gtf >${i}/${i}.readsCount grep -v '^__' ${i}/${i}.readsCount | sed "1 iGene\t${i}" >${i}/${i}.readsCount2 ...