一、软件安装 使用conda安装 conda install featureCounts 二、输入数据 1、输入的数据有两类,一类是SAM/BAM文件,另一类是GTF/GFF/SAF,其中SAM/BAM可以输入一个或多个 2、SAM/BAM文件和GTF/GFF/SAF文件需要来自同一个参考基因组,即必须参考基因组和GTF/GFF/SAF文件来自同一个网站,同一个版本 3、SAM/BAM主要提...
1. 软件用法: 2. 常用参数: 代码语言:javascript 复制 input file # 输入的bam/sam文件,支持多个文件输入-a<string>#参考gtf文件名,支持Gzipped文件格式-F# 参考文件的格式,一般为GTF/SAF,C语言版本默认的格式为GTF格式-A# 提供一个逗号分割为两列的文件,一列为gtf中的染色体名,另一列为read中对应的染色体...
我们嫌弃HTseq-count软件运行速度太慢,所以才想着featureCounts,所以一切都得使用github.com/vivekbhr/Sub 的脚本了。 conda activate rna gtf=/home/yb77613/biosoft/Subread_to_DEXSeq/gencode.v32.annotation.gtf #gtf=/home/yb77613/biosoft/Subread_to_DEXSeq/out_gv32.gtf featureCounts -f -O -p -T 4...
conda activate rna gtf=/home/yb77613/biosoft/Subread_to_DEXSeq/gencode.v32.annotation.gtf #gtf=/home/yb77613/biosoft/Subread_to_DEXSeq/out_gv32.gtf featureCounts -f -O -p -T 4 -F GTF \ -a ok.gtf \ -o test.txt ../star/SRR2016941.bam ...
conda install -c bioconda bioconductor-edger#用了rpkm()函数算的FPKM 脚本使用 -i, --input_path指定含有featurecounts结果的文件夹 -p, --pattern用R中正则指定文件pattern。建议直接将featurecounts的结果文件后缀写为.count,类似``.count` 格式,这个选项用默认的就可以了。
conda activate rna gtf=/home/yb77613/biosoft/Subread_to_DEXSeq/gencode.v32.annotation.gtf #gtf=/home/yb77613/biosoft/Subread_to_DEXSeq/out_gv32.gtf featureCounts-f-O-p-T4-FGTF\-a ok.gtf \-o test.txt../star/SRR2016941.bam-o npc2_fCount.out.txt../star/*bam 1>counts.id.log ...
conda activate rna gtf=/home/yb77613/biosoft/Subread_to_DEXSeq/gencode.v32.annotation.gtf#gtf=/home/yb77613/biosoft/Subread_to_DEXSeq/out_gv32.gtffeatureCounts-f-O -p -T4-F GTF \-aok.gtf \ -o test.txt ../star/SRR2016941.bam ...
conda install -y salmon=1.4.0conda install -y -c bioconda suppa 下载参考转录组fasta序列文件然后使用hisat2构建index文件 这里我们直接使用服务器现成的hisat2的index文件 (其实就是hisat2官网下载的,无需自己构建) $ ls -lh /home/data/server/reference/index/hisat/hg38/ |cut-d" "-f5-974M12月31...
-a参数指定的区间注释文件,默认是gtf格式;-T参数指定线程数,默认是1;-t参数指定想要统计的feature的名称,取值范围是gtf 文件中的第3列的值,默认是exon;-g参数 指定想要统计的meta-feature的名称,取值范围参考gtf第9列注释信息,gtf的第9列为key=value的格式,-g参数可能的取值就是所有的key, 默认值是gene_id。
1.2. 运行脚本(conda 环境下,目录为X_data) ./hisat2_featureCounts.sh cleandata*clean_R1.fq.gz*clean_R2.fq.gz indexes/hg38/genome genes/gencode.v34.annotation.gtf results 2. Stringtie-ballgown流程(承接脚本1的Hisat2-featureCounts流程) ...