这里,模拟一个plink文件的数据,8个样本,8个SNP位点,通过手动Excel计算样本杂合度和位点杂合度,比较plink计算杂合度的方法。 1. 模拟数据 「ped数据:」 $ cat a.ped FAMILY1 ID1 0 0 0 -9 CC CC AA GG AG GG GG GC FAMILY1 ID2 0 0 0 -9 CC GC AG GG GG AA AG CC FAMILY1 ID3 0 0 0...
首先,我们通过plink软件对一个包含8个样本和8个SNP位点的模拟数据进行分析,旨在对比其计算杂合度的准确性。在模拟的ped和map数据中,我们着手计算每个样本的杂合度,这通过plink的het选项实现。F值的计算公式显示,F值越小,样本的杂合度越高,F值越大,纯合度越显著。手动在Excel中,我们复制ped文件...
1、计算位点杂合度,测试数据如下: [root@centos79 test]# ls outcome.map outcome.ped [root@centos79 test]# cat outcome.map ## 8个snp位点1snp10559101snp20852041snp301229481snp402037501snp503127071snp603568631snp704005181snp80487423[root@centos79 test]# cat outcome.ped ## 8个样本 DOR1000-9G G C...
其中F的计算方法: F = O − E N − E F = \frac{O-E}{N-E} F=N−EO−E O: O(HOM) E: E(HOM) N: N(NM) 可以这样认为,F值越小(包括负值),杂合度越高,F值越高,纯合度越高! Excel对比 将ped文件,copy到Excel中,手动计算纯合和杂合的个数,进行统计: 3. 计算SNP位点杂合度 ...
这里,模拟一个plink文件的数据,8个样本,8个SNP位点,通过手动Excel计算样本杂合度和位点杂合度,比较plink计算杂合度的方法。 1. 模拟数据 「ped数据:」 $ cat a.ped FAMILY1 ID1 0 0 0 -9 CC CC AA GG AG GG GG GC FAMILY1 ID2 0 0 0 -9 CC GC AG GG GG AA AG CC ...
2、--het 计算样本杂合度 首先要剔除没有多态的位点: [root@centos79 test]# ls outcome.map outcome.ped [root@centos79 test]#plink--file outcome --maf0.0000001--recode tab --outtest&> /dev/null ## 利用plink的--maf参数剔除没有多态的位点[root@centos79 test]# ls ...
2、--het 计算样本杂合度 首先要剔除没有多态的位点: [root@centos79 test]# ls outcome.map outcome.ped [root@centos79 test]#plink--file outcome --maf0.0000001--recode tab --outtest&> /dev/null ## 利用plink的--maf参数剔除没有多态的位点[root@centos79 test]# ls ...
这里,模拟一个plink文件的数据,8个样本,8个SNP位点,通过手动Excel计算样本杂合度和位点杂合度,比较plink计算杂合度的方法。 1. 模拟数据 ped数据: $ cat a.ped FAMILY1 ID1 0 0 0 -9 CC CC AA GG AG GG GG GC FAMILY1 ID2 0 0 0 -9 CC GC AG GG GG AA AG CC ...