目前,对人类测序数据找突变最常用的软件是GATK,除了速度慢以外,没有其他明显缺点(可以通过部署Spark提高速度;当然,如果有钱,可以购买Sentieon,快了15-20倍)。 和WES不同,RNA-seq对于外显子区域的覆盖度极度不均一,并且由于其数据来自转录本,跨越剪切位点的对比方式也使其与常规全外显子测序大不相同。对于RNA-seq...
此外还有germline, 或者是基于RNA-seq 的突变分析,等等。 后面再来进行补充。 其他学习资源 正好我最近也在学snakemake,有一些基于gatk 的流程项目:OVarFlow: a resource optimized GATK 4 based Open source Variant calling workFlow - PMC[17] ESR-NZ/human_genomics_pipeline: A Snakemake workflow to process si...
突变有多种类型(type),比如同义突变,错义突变,无义突变以及deletion等。又可分为两大类别(class),体细胞突变(somatic mutation)和胚系突变(germline mutation)。而GATK就是这么一个技术平台,可以根据RNAseq、WES、WGS的rawdata进行突变数据分析。在接下来的一段时间里,我会讲详细地讲述使用GATK...
数据源的语料库(The corpus of datasources)是可扩展的,用户可配置的,包括谷歌云存储支持的基于云的数据源。 Funcotator生成一个“变异调用格式(Variant Call Format, VCF)”文件(在INFO字段中增加注释结果)或一个“变异注释格式(Mutation Annotation Format, MAF)”文件。 一些问题反馈 上面文字里的GetPileupSummar...
这个管道能否用于在单细胞ATAC-seq或单细胞RNA-seq数据上调用SNV + InDel? 聊生信 基因组、外显组。人类遗传病。细菌、真菌及病毒基因组。 153篇原创内容 公众号 生信宝典 学生信最好的时间是十年前,其次是现在!10年经验分享尽在生信宝典! 1164篇原创内容 ...
GATK软件提供了5套完整分析流程,我们一般叫它 GATK Best Practices: 1) Germline SNPs + Indels; 2) Somatic SNVs + Indels; 3) RNAseq SNPs + Indels; 4) Germline CNVs; 5) Somatic CNVs。 可以看到,GATK 更多的是倾向于DNA 测序数据的分析,主要识别SNP和CNV 两大类型的变异。详细可以见官网的描述:http...
x-zang / tutorial-gatk4-rnaseq-germline-snps-indels Star 3 Code Issues Pull requests Beginner's tutorial for GATK4 workflow on variant calling from RNA-seq. rna-seq variant-calling gatk4 Updated Feb 25, 2021 Load more… Improve this page Add a description, image, and links to the...
一些问题反馈 上面文字里的GetPileupSummaries和CalculateContamination怎么用还不清楚。应该先使用哪个工具?或者它们应该同时使用吗? 这个管道能否用于在单细胞ATAC-seq或单细胞RNA-seq数据上调用SNV + InDel?
BQSR 全称叫做 Base Quality Score Recalibration, 可以理解为碱基质量校正。对于变异位点的鉴定,碱基质量是非常重要的。比如测序识别到的一个位点,其碱基和参考基因组上的碱基不同,但是其质量值特别低,此时可以认为是一个测序错误,而不是一个SNP位点。
RNA-seq 2.2、germline mutation与somatic mutation https://www.zhihu.com/question/38765318 (1)germline mutation 胚系突变 germline mutation是指上一代的生殖细胞(germ cells)精子或卵子发生突变(如下图左),然后经减数分裂,形成合子,在子代中不断分化增殖(有丝分裂,直接复制),从而在该个体的所有体细胞中都存在...