84females)loaded from.fam.112phenotype values loaded from.fam.Using1thread(no multithreaded calculations invoked).Before main variant filters,112founders and51nonfounders
常染色体上共有1399306位点。 2. 提取常染色体上的位点 这里,用到了位点提取参数--extract plink --bfile HapMap_3_r3_6 --extract snp_1_22.txt --make-bed --out HapMap_3_r3_7 1. 查看日志: PLINK v1.90b6.5 64-bit (13 Sep 2018) www.cog-genomics.org/plink/1.9/ (C) 20...
wc -l snp_1_22.txt 1399306 snp_1_22.txt 常染色体上共有1399306位点。 2. 提取常染色体上的位点 这里,用到了位点提取参数--extract plink --bfile HapMap_3_r3_6 --extract snp_1_22.txt --make-bed --out HapMap_3_r3_7 「查看日志:」 PLINK v1.90b6.5 64-bit (13 Sep 2018) www.cog-...
这是使用plink计算GWAS分析的流程,包括数据的清洗,以及建模,以及出结果,以及可视化。 但是,这只是一个开始,后面再研究一下GEMMA,R中的GAPIT的操作方法,最后能够通过编码进行GWAS的分析,才算是掌握了这个分析方法。 完结感言: 这一系列的学习笔记,主要是根据别人的教程,自己重演了一遍,后面使用其它软件的数据,自己操作...
笔记| GWAS 操作流程1:下载数据 笔记| GWAS 操作流程2-1:缺失质控 笔记| GWAS 操作流程2-2:性别质控 笔记| GWAS 操作流程2-3:MAF过滤 笔记| GWAS 操作流程2-4:哈温平衡检验 笔记| GWAS 操作流程2-5:杂合率检验 笔记| GWAS 操作流程2-6:去掉亲缘关系近的个体 ...
plink的语境叫“case and control”,即表型值数据是两类数据:1,2,其中0和-9都表示缺失。可以选择的方法有卡方检验和逻辑斯蒂回归(X2关联分析和logistic分析)。 「--assoc」,不允许有协变量 「--logistic」,允许有协变量,如果考虑协变量,速度变慢。比assoc速度慢。
笔记GWAS操作流程1:下载数据 ❝❞❝❞
二、GWAS分析流程 基因型数据质控 1)按分型百分比过滤 一般剔除缺失率在20%以上的位点 2)按等位基因频率过滤 去除第二等位基因频率小于5%的位点 3)多等位位点的过滤 根据软件,有些软件不支持多等位位点 4)哈迪温伯格平衡过滤 人类中一般将不符合哈迪温伯格平衡的位点过滤掉,动植物不使用该过滤 ...
笔记| GWAS 操作流程2-1:缺失质控 笔记| GWAS 操作流程2-2:性别质控 笔记GWAS 操作流程2-3:MAF过滤 笔记| GWAS 操作流程2-4:哈温平衡检验 PS吐槽: 微信编辑器中的文章引用功能有bug,上面的超链接有乱码&;|,这都是什么鬼,我不想手动删除了,let it be!
就利用网上的信息写一个操作笔记,先操作plink,然后是EMMAX,有一些模型知识的同学,理解起来应该不难。 GWAS分析的两类性状: 分类性状(阈值性状,质量性状):比如抗病性,颜色等等 连续性在(数量性状):比如株高,体重,产量等等 GWAS的分析方法: 分类性状:logistic等等...