htseq-count计数 reads的计数定量主要可分为三个水平:基因水平、转录组水平、外显子水平。 在基因水平上,常用的软件为HTSeq-count,featureCounts,BEDTools, Qualimap, Rsubread, GenomicRanges等。以常用的HTSeq-count为例,这些工具要解决的问题就是根据read和基因位置的overlap判断这个read到底是谁家的孩子。值得注意的...
FPKM= read counts / (mapped reads (Millions) * exon length) #这里的exon length的单位是kb 这里要先得到的是每个exon的长度,为了求长度,我们先要有基因组注释文件,你可以在这里下载:https://gdc.cancer.gov/about-data/data-harmonization-and-generation/gdc-reference-files。这是GDC官网里的下载网址,进去...