笔记GWAS操作流程2-4:哈温平衡检验maf直接是对基因频率进行筛选而哈温平衡检验则是根据基因型推断出理想的aaattt的分布然后和实际观察的进行适合性检验然后得到p值根据p值进行筛选 笔记GWAS操作流程2-4:哈温平衡检验 「什么是哈温平衡?」 ❝ 哈迪-温伯格(Hardy-Weinberg)法则 哈迪-温伯格(Hardy-Weinberg)法则是群体...
2. 提取哈温p值小于0.0001的位点 这里我们使用awk: awk '{if($9 < 0.0001) print $0}' plink.hwe >plinkzoomhwe.hwe 共有123个位点,其中UNAFF为45个位点。 3. 设定过滤标准1e-4 plink --bfile HapMap_3_r3_8 --hwe 1e-4 --make-bed --out HapMap_3_r3_9 日志: Options in effect: --bfil...
共有123个位点,其中UNAFF为45个位点。 3. 设定过滤标准1e-4 代码语言:javascript 复制 plink--bfile HapMap_3_r3_8--hwe1e-4--make-bed--out HapMap_3_r3_9 日志: 代码语言:javascript 复制 Optionsineffect:--bfile HapMap_3_r3_8--hwe1e-4--make-bed--out HapMap_3_r3_9515185MBRAMdetected;...
2. 提取哈温p值小于0.0001的位点 这里我们使用awk: awk '{if($9 < 0.0001) print $0}' plink.hwe >plinkzoomhwe.hwe 1. 共有123个位点,其中UNAFF为45个位点。 3. 设定过滤标准1e-4 plink --bfile HapMap_3_r3_8 --hwe 1e-4 --make-bed --out HapMap_3_r3_9 1. 日志: Options in effect...
上一篇,我们介绍了数量性状进行GWAS的一般线性模型分析的方法(笔记 | GWAS 操作流程4:LM模型assoc),这里我们考虑一下数字协变量,然后用R语言进行对比。 1. 协变量文件整理 第一列为FID 第二列为ID 第三列以后为协变量(注意,只能是数字,不能是字符!) ...
二、GWAS分析流程 基因型数据质控 1)按分型百分比过滤 一般剔除缺失率在20%以上的位点 2)按等位基因频率过滤 去除第二等位基因频率小于5%的位点 3)多等位位点的过滤 根据软件,有些软件不支持多等位位点 4)哈迪温伯格平衡过滤 人类中一般将不符合哈迪温伯格平衡的位点过滤掉,动植物不使用该过滤 ...
就利用网上的信息写一个操作笔记,先操作plink,然后是EMMAX,有一些模型知识的同学,理解起来应该不难。 GWAS分析的两类性状: 分类性状(阈值性状,质量性状):比如抗病性,颜色等等 连续性在(数量性状):比如株高,体重,产量等等 GWAS的分析方法: 分类性状:logistic等等...
笔记| GWAS 操作流程1:下载数据,这里,总结一下GWAS的学习笔记,GWAS全称“全基因组关联分析”,使用统计模型找到与性状关联的位点,用于分子标记选择(MAS)或者基因定位,这次学习的教程是plink做GWAS,plink是个很好的软件,但是之前做GWAS都是使用R包,听说p
head=TRUE) jpeg("QQ-Plot_logistic.jpeg") qq(results_log$P, main = "Q-Q plot of GWAS p-values : log") dev.off() results_as <- read.table("assoc_results.assoc", head=TRUE) jpeg("QQ-Plot_assoc.jpeg") qq(results_as$P, main = "Q-Q plot of GWAS p-values : log") dev.off...
#Timo笔记# GWAS分析基本流程及思路,参考http://t.cn/Aie8Bc7M GWAS数据预处理:1 测基因型;2 QC http://t.cn/Aie8Bc7x,主要是看数据完整度必须大于95%(我们质量真不行,还有低于70的);MAF(minor allele f...