STAR-Fusion是一个package,可以承接STAR的chimeric output,点我看代码 当然STAR还可以做2-pass mapping,可以detect more splicesreads mapping to novel junctions 使用--quantMode GeneCounts参数还可以达到HTSeq的效果哦,可以帮你生成count matrix,省去你HTSeq的功夫, 有空回来做一个比对,看HTSeq和GeneCounts的效率。
N_unmapped127127127N_multimapping374537453745N_noFeature21487234292234796N_ambiguous2393556785571ENSG00000178591000ENSG00000125788000ENSG00000088782000ENSG00000185982000ENSG00000125903000ENSG00000186458000ENSG00000272874000ENSG00000196476713338 这个结果与HTSeq的输出结果是完全一致的。所以我们如果是比对完之后未做转录本拼装,直接对已...
这个结果与HTSeq的输出结果是完全一致的。所以我们如果是比对完之后未做转录本拼装,直接对已知基因(构建基因组索引时GTF中囊括的基因)进行定量时,完全不需要再次用featureCounts或HTSeq再计算reads count。 如果做了转录本拼装,对基因定量,需要HTSEQ/FEATURECOUNTS 假设我们用STAR比对后,做了转录本拼装,获得一个拼装比较...
这个结果与HTSeq的输出结果是完全一致的。所以我们如果是比对完之后未做转录本拼装,直接对已知基因(构建基因组索引时GTF中囊括的基因)进行定量时,完全不需要再次用featureCounts或HTSeq再计算reads count。 如果做了转录本拼装,对基因定量,需要HTSEQ/FEATURECOUNTS 假设我们用STAR比对后,做了转录本拼装,获得一个拼装比较...
种类型的文件都比较容易理解,剪切位点文件实际上是根据 mapping 情况,估算出来的 intron 区间的信息,默认的文件名称为 SJ.out.tab。 默认输出的比对文件为 SAM 格式,为了节省磁盘空间,方便下游 分析,可以通过 outSAMtype 参数指定输出 bam 文件,该参数有两 个字段值,第一个值指定文件类型, 取值有 SAM 和 BAM ...
(0:undened,1:+,2:-)column 5: intron motif: 0:non-canonical;1:GT/AG,2:CT/AC,3:GC/AG,4:CT/GC,5:AT/AC,6:GT/ATcolumn 6: 0:unannotated,1:annotated(onlyifsplicejunctionsdatabaseisused)column 7:numberofuniquelymappingreadscrossingthejunctioncolumn 8:numberofmulti-mappingreadscrossingthe...
--readFilesIn reads.fq \ --sjdbGTFfile hg19.gtf \ --sjdbOverhang 149 \ --outFileNamePrefix sampleA \ --outSAMtype BAM SortedByCoordinate 1. 2. 3. 4. 5. 6. 7. 8. 双端数据比对的基本用法如下 STAR \ --runThreadN 20 \ --genomeDir hg19_STAR_db \ ...
Only affects multi-mapping reads. outSAMorder Paired string: type of sorting for the SAM output Paired: one mate after the other for all paired alignments PairedKeepInputOrder: one mate after the other for all paired alignments, the order is kept the same as in the input FASTQ files outSAM...
multi-sample 2-pass 第一次比对和上述的用法一致,比对完之后,每个样本会产生一个intron的区间文件SJ.out.tab; 在第二次比对之前,重新构建一次基因组的索引,添加所有样本的SJ.out.tab文件,然后利用新的基因组索引重新比对。这种做法综合了多个样本的intron信息,比对的灵敏度会更高,缺点是操作比较繁琐。
Countingmulti-gene(multimapping) reads Major updates in STAR 2.7.8a (2021/02/20) Cell calling (filtering) similar to CellRanger: --soloCellFilter EmptyDrops_CRoption for cell filtering (calling) nearly identical to that of CellRanger 3 and 4 ...