「单个位点缺失率统计:」 「基因型个体缺失率统计:」 4. 对个体及SNP缺失率进行筛选 1, 如果一个SNP在个体中2%都是缺失的,那么就删掉该SNP,参数为:--mind 0.02 2,如果一个个体,有2%的SNP都是缺失的,那么就删掉该个体,参数为:--geno 0.02 4. 1 对个体缺失率进行筛选 「先过滤个体缺失率高于2%的SNP」 ...
1, 如果一个SNP在个体中2%都是缺失的,那么就删掉该SNP,参数为:--geno 0.02 2,如果一个个体,有2%的SNP都是缺失的,那么就删掉该个体,参数为:--mind 0.02 4. 1 对个体缺失率进行筛选 先过滤个体缺失率高于2%的SNP plink --bfile HapMap_3_r3_1 --geno 0.02 --make-bed --out HapMap_3_r3_2 1. ...
HapMap_3_r3_8.bed HapMap_3_r3_8.bim HapMap_3_r3_8.fam HapMap_3_r3_8.log 后面我们用这个文件,进行后续的质控。 相关系列: 笔记GWAS操作流程1:下载数据 笔记GWAS操作流程2-1:缺失质控 笔记GWAS操作流程2-2:性别质控
笔记| GWAS 操作流程2-1:缺失质控 笔记| GWAS 操作流程2-2:性别质控 笔记GWAS 操作流程2-3:MAF过滤 笔记| GWAS 操作流程2-4:哈温平衡检验 PS吐槽: 微信编辑器中的文章引用功能有bug,上面的超链接有乱码&;|,这都是什么鬼,我不想手动删除了,let it be! 我的公众号:...
1. 去掉性染色体上的位点 「思路:」 在map文件中选择常染色体,提取snp信息 根据snp信息进行提取 「提取常染色体上的位点名称:」 因为这里是人的数据,所以染色体只需要去1~22的常染色体,提取它的家系ID和个体ID,后面用于提取。 awk '{ if($1 >=1 && $1 <= 22) print $2}' HapMap_3_r3_6.bim > sn...
上一次我们经过去掉缺失,去掉错误的性别信息,得到的文件为: HapMap_3_r3_6.bed HapMap_3_r3_6.fam HapMap_3_r3_6.log HapMap_3_r3_6.bim HapMap_3_r3_6.hh 1. 2. 这里,我们根据最小等位基因频率(MAF)去筛选。 为什么要根据MAF去筛选?
这是使用plink学习GWAS中质控的最后一篇,后面是使用GLM和MLM模型进行建模,以及对结果的整理和可视化。 这里,我们要对一些亲子关系的个体,进行一下过滤,计算类似IBS的结果。 「注意:」 ❝这里讲亲子关系的个体移除,不是必须要的,比如我们分析的群体里面有亲子关系的个体,想要进行分析,不需要做这一步的筛选。 ❞ ...
❝ 无论是测序还是芯片,得到的基因型数据要进行质控,而对缺失数据进行筛选,可以去掉低质量的数据。如果一个个体,共有50万SNP数据,发现20%的SNP数据(10万)都缺失,那这个个体我们认为质量不合格,如果加入分析中可能会对结果产生负面的影响,所以我们可以把它删除。同样的道理,如果某个SNP,在500个样本中,缺失率为20...
❝ 这个章节,主要是人类性别的信息的质控,主要是根据性染色上SNP的比值,判断性别,然后把性别错误的个体去掉或者更改性别信息。对其它物种参考意义不大,因为在动物中一般把性别信息的SNP去掉,植物中一般都是 雌雄同体 的,不涉及到这个问题,之所以会有这一篇,是因为原文中有这个信息,而且plink 也有--check-sex的参数...
1. 计算杂合度 代码语言:javascript 复制 plink--bfile HapMap_3_r3_9--het--out R_check 结果文件: 代码语言:javascript 复制 .het(method-of-momentsFcoefficient estimates)Produced by--het.Atext filewitha header line,and one line per samplewiththe following six fields:FIDFamilyID# 家系IDIIDWithin...