基因型数据就像是一堆小零件,有些可能是坏的,有些可能放错地方了,咱们清洗就是要把这些问题都解决掉。 二、基本的清洗标准 1.完整性检查 数据要是不完整啊,那就像拼图少了几块,根本没法看全整个画面。咱们得看看有没有数据缺失的情况。比如说,某个基因位点的信息少了,这可不行。如果发现缺失,那就要想办法...
rs9930506sample.bed+rs9930506sample.bim+rs9930506sample.fam 5. plink和表型数据合并 如果想要把表型数据和基因型数据合并,需要整理的表型格式:FID,IID,y三列。 FIDIIDBMI 0HG0009625.022827 0HG0009724.853638 0HG0009923.689295 0HG0010027.016203 0HG0010121.461624 0HG0010220.673635 0HG0010325.71508 0HG0010425.252243 ...
这里介绍一下常用的基因型数据清洗方法。 数据 《统计遗传学》中的章节介绍,有关代码实操部分,单独列出来,进行展示。 我已经下载整理好了,下载本书的电子版pdf+数据+代码,链接:书籍及配套代码领取--统计遗传分析导论 1 二进制文件 文件中包括二进制的三个文件: 2. plink二进制文件变为文本文件(ped和map) 命令 ...
6.2 缺失 6.3 哈温检测 6.4 杂合率检测 7. 数据质控qc 7.1 样本质控--mind 7.2 位点质控--geno 7.3 maf质控--maf 7.4 哈温质控 --hwe 很多分析之前,都要做基因型数据清洗,包括: ...
我们知道很多分析之前,都要做基因型数据清洗,包括: GWAS分析 GS分析 …… 这里介绍一下常用的基因型数据清洗方法。 数据 1 二进制文件 2. plink二进制文件变为文本文件(ped和map) 3. plink将vcf转化为plink文件 4. 提取样本和SNP 4.1 提取样本 4.2 提取SNP ...
我们知道很多分析之前,都要做基因型数据清洗,包括: GWAS分析 GS分析 …… 这里介绍一下常用的基因型数据清洗方法。 数据 1 二进制文件 2. plink二进制文件变为文本文件(ped和map) 3. plink将vcf转化为plink文件 4. 提取样本和SNP 4.1 提取样本 4.2 提取SNP 5. plink和表型数据合并 6. 数据汇总 6.1 次等位...