vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和--remove-indv,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。 具体用法如下: 只保留1和10号两个样品,执行以下代码: vcftools--vcfin.vcf--recode--recode-INFO-all--stdout--indv1--indv10> out.vcf AI代码助手复...
vcftools --vcf in.vcf --recode --recode-INFO-all --stdout --remove-indv 1> out.vcf 如果样品较多,也可将样品保存到文件 id.txt 中,每行为一个样品ID,格式如下: 1 105 然后使用下面两个选项对vcf文件保留或者删除样品。 --keep<filename>保留样品 --remove<filename>删除样品 代码如下: vcftools -...
then the “–keep” option is executed before the “–remove” option. When multiple files are provided, the union of individuals from all keep files subtracted
如果你想从VCF文件中只提取SNP或InDel变异,可以使用--remove-indels或--keep-only-indels选项。例如,只保留SNP: bash vcftools --vcf in.vcf --remove-indels --recode --recode-INFO-all --out snp_only.vcf 或者只保留InDel: bash vcftools --vcf in.vcf --keep-only-indels --recode --recode-INFO...
–remove-INFO<string> 根据ALLELE过滤 –maf <float> MAF最小值过滤 –max-maf <float> MAF最大值过滤 此处省去很多参数,具体参见vcftools官网 根据基因型数值过滤 –min-meanDP<float> –max-meanDP <float>根据测序深度进行过滤 –hwe<float> –max-missing <float>完整度,该参数介于0,1之间 ...
过滤数据是高频操作。比如剔除缺失率高于30%的位点:vcftools–vcf input.vcf –max-missing 0.7 –recode –recode-INFO-all –outfiltered。注意这里0.7代表保留70%完整度的位点,输出文件自动命名为filtered.recode.vcf。需要同时过滤样本时,先用–keep或–remove参数指定样本列表文件。例如vcftools–vcf raw.vcf ...
3. 对vcf文件进行划窗处理:使用--window-pi和--window-pi-step参数,用户可以对vcf文件进行滑窗处理,统计每个自定义大小窗口内的变异位点数量和多态性pi值。4. 去除和保留vcf中指定样本:通过--keep和--remove参数,用户可以选择保留或删除特定样本的变异信息。5. 计算vcf文件的snp缺失率:使用--...
vcftools --vcf GT_AGCT_Liujingyan.vcf --max-missing 0.5 --maf 0.05 --remove-indels -- ...
vcftools可以随机抽取指定个样品的vcf文件,用到的选项为--max-indv,指定要从vcf文件中随机抽取指定个样品。 具体用法如下: 下图为原始vcf文件。 随机抽取5个样品,执行以下代码: vcftools --vcf snp.vcf --max-indv 5 --remove-indels --recode --out outfilename ...
vcftools--gzvcf Massoko_Dryad_VCF_final.vcf.gz--keep inds_to_keep.txt--stdout--recode--recode-INFO-all--remove-indels|bgzip>Massoko_Dryad_VCF_final_subset_noIndels.vcf.gz 为了减小计算压力,进一步对文件进行处理(这一步使用到的两个参数自己还不太明白是什么意思,这一步完全照搬原教程) ...