hisat2 输出文件是sam格式,可通过管道符与Samtools工具连用,直接生成bam,并对bam文件进行sorted以方便后续数据处理 代码语言:javascript 代码运行次数:0 运行 AI代码解释 hisat2-p2-x ${index}-1$fq1-2$fq2|samtools sort-@6-o./${sample}.bam- 批量运行脚本 代码语言:javascript 代码运行次数:0 运行 AI代...
samtools sort -@ {threads} -o {output.bam} {input.sam} """ rule stringtie: input: gtf = config['gtf_folder'], bam = rules.samtools.output.bam output: gtf = config['output_folder'] + "output.gtf/{srr}.gtf" params: l = "{srr}" threads: 8 shell: """ stringtie -p {threads}...
3. samtools 对输出 sam 文件排序并转为 bam 文件# -@为samtools的线程数 samtools sort -@ 10 -o test1.sorted.bam test.sam4. 转录本组装# 组装转录本,-p为线程数,-G为组装参考注释文件,-l为输出文件名前缀 # 单个样本运行 stringtie -p 10 -G Mus_musculus.GRCm38.102.gtf -l test1 -o ...
samtools sort -@ 60 -m 4G -o ${out}.sorted.bam ${out}.bam stringtie -p 60 -G ${gff} -B -e -l ${label} -o ${out}/${out}.gtf ${out}.sorted.bam注 注:最后输出文件包含我想要的表达量gtf文件(包括FPKM,TPM)以及几个.ctab中间文件。我用了60个线程,注意修改代码中的线程数。标签...
二,stringtie 比对完之后,就要确定基因或者转录本的表达量了。这里用到了第一步用到的gtf文件。 1 2 3 4 5 6 7 8 9 10 stringtie的输入BAM文件需要先进行sort samtools view -Su alns.sam ' samtools sort - alns.sorted stringtie alns.sorted.bam -b stringtie_input_dir -e -G hg19.annotation.gtf ...
stringtie -p 6 -G /home/sisc/ref_genome/Bol_kaleZHn/Bol_kaleZHn.gff3 -o /home/sisc/raw_sequences/2_hisat2/4_stringtie/Y-T25-T2-1_genome.gtf -l Y-T25-T2-1_genome /home/sisc/raw_sequences/2_hisat2/3_samtools/Y-T25-T2-1_genome.bam ...
hisat2 输出文件是sam格式,可通过管道符与Samtools工具连用,直接生成bam,并对bam文件进行sorted以方便后续数据处理 hisat2 -p 2 -x${index}-1$fq1-2$fq2| samtools sort -@ 6 -o ./${sample}.bam - 批量运行脚本 mkdir 04.mapping ls /home/data/lihe/lncRNA_project/03.trim/*_1.fq.gz > 1 ...
2.2 samtools 处理比对结果 最终我们获得了12个sam文件(此处只列举其中一个样本)然后通过samtools将sam文件转换为bam文件,作为stringtie的输入文件,具体脚本为: samtools view -F 4 -Su C1-1.HISAT_aln.sam | samtools sort -T C1-1.accepted_hits -o C1-1.accepted_hits.bam && samtools index C1-1.accepte...
perl CountToFPKM.pl 04_Result/Stringtie/featureCounts/01.all.count.txt > 04_Result/Stringtie/featureCounts/02.all.FPKM.txt 一、写在前面 今天分享一个转录组上游分析的流程(Hisat2-Stringtie-Count),此流程的操作依旧是非常简单的。我们的流程主要使用软件的安装、数据下载、过滤、比对、Count、Count To FPKM...
Ballgown根据实验条件,分析并统计基因、转录本的差异表达。技术细节Hisat2比对与Samtools处理:通过脚本将sam文件转换为bam文件,作为StringTie的输入。StringTie组装与预测新基因:使用StringTie组装转录组,生成gtf文件记录转录本信息,合并为单个gtf文件,与已知注释文件比较筛选新基因。筛选新基因:通过GTf文件...