图中可以看出,woman中,大部分都是小于0.2,有一个为1,应该是错误的ID。 2. 提取错误的ID 我们使用awk过滤一下: 根据STATUS列,如果有问题的话,为“PROBLEM”,我们可以根据这个关键词将有问题的行打印出来。 grep "PROBLEM" plink.sexcheck 1349 NA10854 2 1 PROBLEM 0.99 可以看出,个体NA10854是有问题的。
可以看出,个体NA10854是有问题的。 将相关错误的ID提取出来(家系ID,个体ID),之所以提取家系ID和个体ID,因为plink有参数remove可以根据ID进行筛选。 grep 'PROBLEM' plink.sexcheck | awk '{print $1,$2}' >sex_discrepancy.txt 1. 我们将结果保存在sex_discrepancy.txt。 3. 使用remove去掉个体 plink --bfil...
female=subset(gender, gender$PEDSEX==2) hist(female[,6],main="Women",xlab="F") dev.off() 图中可以看出,woman中,大部分都是小于0.2,有一个为1,应该是错误的ID。 2. 提取错误的ID 我们使用grep过滤一下:根据STATUS列,如果有问题的话,为“PROBLEM”,我们可以根据这个关键词将有问题的行打印出来。
LD系数:r^2=0,群体中两个位点完全不相关,=1说明完全相关(完全连锁) 一般而言,两个位点在基因组上离得越近,相关性就越强,LD系数越大;反之,LD系数就越小。 →随着位点间的距离不断增加,LD系数通常情况下会慢慢下降,常用LD衰减图呈现 GWAS标记量 = 基因组大小/LD衰减距离 群体结构(Q)和亲缘关系(K) 目的:...
笔记| GWAS 操作流程1:下载数据 笔记| GWAS 操作流程2-1:缺失质控 笔记| GWAS 操作流程2-2:性别质控 笔记| GWAS 操作流程2-3:MAF过滤 笔记| GWAS 操作流程2-4:哈温平衡检验 笔记| GWAS 操作流程2-5:杂合率检验 笔记| GWAS 操作流程2-6:去掉亲缘关系近的个体...
笔记GWAS操作流程1:下载数据 ❝❞❝❞
head=TRUE) jpeg("QQ-Plot_logistic.jpeg") qq(results_log$P, main = "Q-Q plot of GWAS p-values : log") dev.off() results_as <- read.table("assoc_results.assoc", head=TRUE) jpeg("QQ-Plot_assoc.jpeg") qq(results_as$P, main = "Q-Q plot of GWAS p-values : log") dev.off...
笔记| GWAS 操作流程1:下载数据,这里,总结一下GWAS的学习笔记,GWAS全称“全基因组关联分析”,使用统计模型找到与性状关联的位点,用于分子标记选择(MAS)或者基因定位,这次学习的教程是plink做GWAS,plink是个很好的软件,但是之前做GWAS都是使用R包,听说p
#Timo笔记# GWAS分析基本流程及思路,参考http://t.cn/Aie8Bc7M GWAS数据预处理:1 测基因型;2 QC http://t.cn/Aie8Bc7x,主要是看数据完整度必须大于95%(我们质量真不行,还有低于70的);MAF(minor allele f...
笔记GWAS操作流程2-4:哈温平衡检验maf直接是对基因频率进行筛选而哈温平衡检验则是根据基因型推断出理想的aaattt的分布然后和实际观察的进行适合性检验然后得到p值根据p值进行筛选 笔记GWAS操作流程2-4:哈温平衡检验 「什么是哈温平衡?」 ❝ 哈迪-温伯格(Hardy-Weinberg)法则 哈迪-温伯格(Hardy-Weinberg)法则是群体...