are missing.)--make-bed to HapMap_3_r3_2.bed+HapMap_3_r3_2.bim+HapMap_3_r3_2.fam...done. 可以看到--geno,过滤了27454个位点。 4. 2 对SNP缺失率进行筛选 「过滤SNP缺失率高于2%的个体」 代码语言:javascript 复制 plink--bfile HapMap_3_r3_2--mind0.02--make-bed--out HapMap_3_r3_...
笔记GWAS 操作流程2-3:MAF过滤 上一次我们经过去掉缺失,去掉错误的性别信息,得到的文件为: 代码语言:javascript 复制 HapMap_3_r3_6.bed HapMap_3_r3_6.fam HapMap_3_r3_6.log HapMap_3_r3_6.bim HapMap_3_r3_6.hh 这里,我们根据最小等位基因频率(MAF)去筛选。 「为什么要根据MAF去筛选?」 ❝最...
笔记| GWAS 操作流程2-6:去掉亲缘关系近的个体 这是使用plink学习GWAS中质控的最后一篇,后面是使用GLM和MLM模型进行建模,以及对结果的整理和可视化。 这里,我们要对一些亲子关系的个体,进行一下过滤,计算类似IBS的结果。 「注意:」 ❝这里讲亲子关系的个体移除,不是必须要的,比如我们分析的群体里面有亲子关系的个...
笔记| GWAS 操作流程2-5:杂合率检验 一般自然群体,基因型个体的杂合度过高或者过低,都不正常,我们需要根据杂合度进行过滤。偏差可能表明样品受到污染,近亲繁殖。我们建议删除样品杂合率平均值中偏离±3 SD的个体。 ❝我的理解:非自然群体中,比如自交系,杂交种F1,这些群体不需要过滤杂合度。 ❞ 「参数过滤和...
笔记GWAS操作流程2-4:哈温平衡检验maf直接是对基因频率进行筛选而哈温平衡检验则是根据基因型推断出理想的aaattt的分布然后和实际观察的进行适合性检验然后得到p值根据p值进行筛选 笔记GWAS操作流程2-4:哈温平衡检验 「什么是哈温平衡?」 ❝ 哈迪-温伯格(Hardy-Weinberg)法则 哈迪-温伯格(Hardy-Weinberg)法则是群体...
GWAS分析时,拿到基因型数据,拿到表型数据,要首先做以下几点: 1,查看自己的表型数据,是否有问题 2,查看自己的基因型数据,是否有问题 然后再进行建模,得到显著性SNP以及可视化结果。 清洗数据的时间占80%的时间,有句话这样讲:“Garbage in, Garbage out(垃圾进,垃圾出)”,所以清洗数据非常重要,今天学习一下基因组...
GWAS分析时,拿到基因型数据,拿到表型数据,要首先做以下几点: 1,查看自己的表型数据,是否有问题 2,查看自己的基因型数据,是否有问题 然后再进行建模,得到显著性SNP以及可视化结果。 清洗数据的时间占80%的时间,有句话这样讲:“Garbage in, Garbage out(垃圾进,垃圾出)”,所以清洗数据非常重要,今天学习一下基因组...
这是使用plink计算GWAS分析的流程,包括数据的清洗,以及建模,以及出结果,以及可视化。 但是,这只是一个开始,后面再研究一下GEMMA,R中的GAPIT的操作方法,最后能够通过编码进行GWAS的分析,才算是掌握了这个分析方法。 完结感言: 这一系列的学习笔记,主要是根据别人的教程,自己重演了一遍,后面使用其它软件的数据,自己操作...
笔记GWAS 操作流程2-1:缺失质控,GWAS分析时,拿到基因型数据,拿到表型数据,要首先做以下几点:1,查看自己的表型数据,是否有问题2,查看自己的基因型数据,是否有问题然后再进行建模,得到显著性SNP以及可视化结果。清洗数据的时间占80%的时间,有句话这样讲:“Garba
笔记| GWAS 操作流程1:下载数据 笔记| GWAS 操作流程2-1:缺失质控 笔记| GWAS 操作流程2-2:性别质控 笔记GWAS 操作流程2-3:MAF过滤 笔记| GWAS 操作流程2-4:哈温平衡检验 PS吐槽: 微信编辑器中的文章引用功能有bug,上面的超链接有乱码&;|,这都是什么鬼,我不想手动删除了,let it be!