三、获取基因ID转化的对应文件 由于本次使用的为gencode或ensembl的gtf与cdna文件,因此最后得到的为ensembl_id (gene_id)和 transcript_id,形式为:ENSMUSG00000000001.1 ,而我们下游常用gene symbol进行展示,因此还需要从gtf注释文件中获取ensembl_id 、transcript_id与gene symbol的对应关系文件。 方法如下: vim gtf...
1. -t <feature_type>:设置要计数的特征类型,如gene、transcript、exon等。默认为gene。 2. -g <attribute_type>:设置要使用的特征属性类型。对于基因,可以使用gene_id、gene_name等;对于转录本,可以使用transcript_id、transcript_name等。默认为gene_id。 3. -a <annotation_file>:指定注释文件的路径。该文...
### 从featurecounts 原始输出文件counts.txt中提取Geneid、Length(转录本长度),计算tpm geneid_efflen <- subset(a1,select = c("Geneid","Length")) colnames(geneid_efflen) <- c("geneid","efflen") ### 取出counts中geneid对应的efflen efflen <- geneid_efflen[match(rownames(counts), gene...
三、获取基因ID转化的对应文件 由于本次使用的为gencode或ensembl的gtf与cdna文件,因此最后得到的为ensembl_id (gene_id)和 transcript_id,形式为:ENSMUSG00000000001.1 ,而我们下游常用gene symbol进行展示,因此还需要从gtf注释文件中获取ensembl_id 、transcript_id与gene symbol的对应关系文件。 方法如下: 代码语言...
获取ensembl_id或transcript_id转化的对应文件 承接上节RNA-seq入门实战(一) 本节介绍使用hisat2或salmon这两种方法进行转录组上游数据的比对和计数。 39个转录组分析工具,120种组合评估 (https://www.nature.com/articles/s41467-017-00050-4) 表明基于hisat2或salmon进行转录本定量都比较优秀。
##载入transcript_id和symbol的对应关系文件 t2s <- fread("t2s_vm25_gencode.txt", data.table = F, header = F); head(t2s) ##找到所有quant.sf文件所在路径 导入salmon文件处理汇总 files <- list.files(pattern="*quant.sf",recursive=T, full.names = T); files #显示目录下所有符合要求的文件...
-T5# 设置线程数为5-p # paired-end,会统计fragment而不统计read-t exon # reads只有落到exon上才会被统计到,-g transcript_id # 使用transcript_id,来将feature(exon)水平的统计汇总为meta-feature水平的统计 五、结果解读 代码语言:javascript 代码运行次数:0 ...
指定要计数的特征类型,如gene、exon、transcript等。默认为gene。 -a或--annotationFile。指定参考基因组注释文件。 -g或--attributeType。指定注释文件中特征的名称。默认为gene_id。 2.分析参数 分析参数指的是FeatureCounts进行基因表达分析时所使用的统计方法和计数方法等。在FeatureCounts中,分析参数有以下几个: -...
接下来看下正文部分,以第一行为例,在gtf 文件中共gene_id 为 LOC102725121 的行如下 chr1 refGene transcript 11869 14362 . + . gene_id "LOC102725121"; transcript_id "NR_148357"; gene_name "LOC102725121"; chr1 refGene exon 11869 12227 . + . gene_id "LOC102725121"; transcript_id "NR_148...
-g transcript_id# 使用transcript_id,来将feature(exon)水平的统计汇总为meta-feature水平的统计 五、结果解读 gene_id:# 基因名 chr:# 位于的染色体 start:# exon起始位置 end:# exon终止位置 strand# 正负链 length# 转录本长度 # 后面的列为reads数目 ...