(base) [root@PC1 test]#vcftools --vcf outcome.vcf --max-missing0.9--plink --outtest &> /dev/null(base) [root@PC1 test]# ls## 最大丢失率不超过1-0.9outcome.map outcome.ped outcome.vcf test.map test.ped (base) [root@PC1 test]#cat test.map1snp402037501snp50312707...
如果缺失率较高,这种snp位点在很多分析中是不能用的,需要去掉。这时候就可以使用vcftools进行过滤。用到的选项为--max-missing。 具体用法如下: 运行以下命令: vcftools--vcfsnp.vcf--recode--recode-INFO-all--stdout--max-missing1> snp.new.vcf AI代码助手复制代码 --max-missing 后跟的值为 0-1 ,1代表...
如果缺失率较高,这种snp位点在很多分析中是不能用的,需要去掉。这时候就可以使用vcftools进行过滤。用到的选项为--max-missing。 具体用法如下: 下图为原始vcf文件。 运行以下命令: vcftools --vcf snp.vcf --recode --recode-INFO-all --stdout --max-missing 1 > snp.new.vcf --max-missing 后跟的值为 ...
–max-missing常用,缺失率,0为接受完全缺失,1为接受数据全都存在。一般0.8 –max-missing-count INT缺失的个体数目超过INT,即被过滤。 –phased 删除unpased位点 –minQ 保留Quality值大于INT的位点。 对样品个体进行过滤 –indv, --remove-indv保留或删除指定样本 –keep FILE,–remove 保留/删除多个体的文件 ...
# --max-missing 1.0,不允许有缺失的基因型,--max-missing的值在0-1之间,0代表完全允许 结果文件(all_snp_hardy.hwe) 6,计算pi(π) vcftools --vcf all.SNP.vcf --window-pi 10000 --window-pi-step 100 --out L_donovani_all_samples_10kb_100b ...
在这段代码中,我们调用vcftools,在--vcf标志后给它一个vcf文件, - max-missing 0.5告诉它过滤低于50%的基因型(跨所有个体)--mac 3标志告诉它过滤次要等位基因计数小于3的SNP。 这与基因型有关,因此必须在至少1个纯合子和1个杂合子或3个杂合子中的变异调用。 --recode标志告诉程序使用过滤器写入一个新的vc...
–max-maf <float> MAF最大值过滤 此处省去很多参数,具体参见vcftools官网 根据基因型数值过滤 –min-meanDP<float> –max-meanDP <float>根据测序深度进行过滤 –hwe<float> –max-missing <float>完整度,该参数介于0,1之间 根据材料过滤 –indv
–gzvcf:处理压缩格式的vcf文件(可替换为–vcf)–chr n:选择染色体n,例:–chr 1 –recode:重新编码为vcf文件,有过滤操作都要加上--recode –recode-INFO-all:将输出的文件保存所有INFO信息 –stdout:标准输出,后接管道命令 –gzip -c:压缩 --max-missing --max-missing的取值是0-1,...
–max-missing 完整度,该参数介于0,1之间 根据材料过滤 –indv –remove-indv Specify an individual to be kept or removed from the analysis. This option can be used multiple times to specify multiple individuals. If both options are specified, then the “–indv” option is executed before the...
Dear developers, I saw a strange behavior using vcftools with --max-missing option: If I filter this vcf file with --minDP 2 and --max-missing 0.7 in the same command line, I will retrieve SNPs called on 60% of my samples, while filterin...