第一步:利用工具BaseRecalibrator,根据一些known sites,生成一个校正质量值所需要的数据文件,GATK网站以“.grp”为后缀命名。 e.g. java -jar GenomeAnalysisTK.jar -T BaseRecalibrator -R hg19.fa -I ChrALL.100.sam.dedup.realn.07.bam -knownSites dbsnp_137.hg19.vcf -knownSites Mills_and_1000G_go...
-TBaseRecalibrator\ -R/path/to/human.fasta\ -Isample_name.sorted.markdup.realign.bam\ --knownSites/path/to/gatk/bundle/1000G_phase1.indels.b37.vcf\ --knownSites/path/to/gatk/bundle/Mills_and_1000G_gold_standard.indels.b37.vcf\ --knownSites/path/to/gatk/bundle/dbsnp_138.b37.vcf\ ...
第一步:利用工具BaseRecalibrator,根据一些known sites,生成一个校正质量值所需要的数据文件,GATK网站以“.grp”为后缀命名。 e.g. java -jar GenomeAnalysisTK.jar -T BaseRecalibrator -R hg19.fa -I ChrALL.100.sam.dedup.realn.07.bam -knownSites dbsnp_137.hg19.vcf -knownSites Mills_and_1000G_go...
GATK使用方法详解(原始数据的处理)1. 对原始下机fastq文件进行过滤和比对(mapping)对于Illumina下机数据推荐使用bwa进行mapping。Bwa比对步骤大致如下:(1)对参考基因组构建索引:例子:bwa index -a bwtsw hg19.fa。最后生成文件:hg19.fa.amb、hg19.fa.ann、hg19.fa.bwt、hg19.fa.pac和hg19.fa.sa。构建...
Base Quality Score Recalibration (BQSR)第一步: $JAVA_HOME/bin/java -jar ./GenomeAnalysisTK.jar \ -T BaseRecalibrator \ -R ref.fasta \ -I input.Bam \ -knownSites 1000G_phase1.snps.high_confidence.hg38.vcf \ -knownSites dbsnp_146.hg38.vcf \ ...
-knownSites 已知SNP的vcf文件 -o : 输出的重校准表 我是如何用的 首先我用BaseRecalibrator根据snp数据建立了重校准表,然后又做了一次重校准,用AnalyzeCovariates作图(要有R环境)观察前后变化,最后用PrintReads应用。 # Analyze patterns of covariation in the sequence dataset ...
GATK使用方法详解(原始数据的处理)1. 对原始下机fastq文件进行过滤和比对(mapping)对于Illumina下机数据推荐使用bwa进行mapping。Bwa比对步骤大致如下:(1)对参考基因组构建索引:例子:bwa index -a bwtsw hg19.fa。最后生成文件:hg19.fa.amb、hg19.fa.ann、hg19.fa.bwt、hg19.fa.pac和hg19.fa.sa。构建...
gatk MarkDuplicates\-I input.bam\-O marked_duplicates.bam\-M marked_dup_metrics.txt 2. 碱基质量分数重校准 (BQSR) # STEP1: 生成recal_data.table表 gatk BaseRecalibrator \ -I marked_duplicates.bam \ -R reference.fasta \ --known-sites known_sites.vcf \ ...
3. Base(Quality Score) Recalibration 运行BQSR包括三步,第一步的命令如下: gatk BaseRecalibrator \ -R ${ref_fasta} \ -I ${input_bam} \ --use-original-qualities \ -O ${recalibration_report_filename} \ --known-sites ${dbSNP_vcf} \ ...
运行时间(min) bwa index 构建索引 54 bwa mem 比对 25 samtools sort 排序 2 gatk MarkDuplicates 去重 13 gatk CreateSequenceDictionary 创建字典 0.15 gatk BaseRecalibrator 构建校准表 40 gatk ApplyBQSR 重校准 21 gatk HaplotypeCaller 变异检查 211