vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和--remove-indv,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。 具体用法如下: 只保留1和10号两个样品,执行以下代码: vcftools--vcfin.vcf--recode--recode-INFO-all--stdout--indv1--indv10> out.vcf AI代码助手复...
vcftools --vcf in.vcf --recode --recode-INFO-all --stdout --remove-indv 1> out.vcf 如果样品较多,也可将样品保存到文件 id.txt 中,每行为一个样品ID,格式如下: 1 105 然后使用下面两个选项对vcf文件保留或者删除样品。 --keep<filename>保留样品 --remove<filename>删除样品 代码如下: vcftools -...
–remove-indels即保留或去除SNP,留下INDEL。 根据VCF文件第七列FILTER进行过滤 –remove-filterer-allFILTER列除了PASS保留,其余都过滤 –keep-filtered,–remove-filtered保留或去除特定FILTER标签。可多次使用。 根据vcf第八列INFO进行过滤 –keep-INFO –remove-INFO根据INFO列的指定tag进行过滤 根据ALLEL进行过滤 –...
vcftools --vcf snp_indel.vcf --remove-indels --recode --recode-INFO-all --out SNPs_only # --remove-indels 移除indel位点信息,若想移除snp位点信息则用--keep-only-indels # --recode 这个参数和上面--freq的意思差不多,不能少,否则没有结果文件 # --recode-INFO-all,原vcf文件有一列为INFO,这里...
--keep :保留样品--remove : 删除样品 5. vcftools计算vcf文件的snp缺失率 vcftools --vcf sample.snp.vcf\--missing-indv --out sample# 结果文件# sample.imissvcftools --vcf sample.snp.vcf\--missing-site --out sample# 结果文件# sample.lmiss ...
vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和--remove-indv,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。 具体用法如下: 下图为原始vcf文件。 只保留1和10号两个样品,执行以下代码: vcftools --vcf in.vcf --recode --recode-INFO-all --stdout --indv 1-...
vcf文件中可能会同时是包含snp以及indel两种变异类型,如果想将其分开,可利用vcftools实现。 具体用法如下: 下图为原始vcf文件(raw.vcf),可以看到包含indel以及snp。 过滤掉indel,只保留snp--remove-indels。 执行以下命令: vcftools --remove-indels --recode --recode-INFO-all --vcf raw.vcf --stdout >raw.snp...
–remove-INFO Includes or excludes all sites with a specific INFO flag. These options only filter on the presence of the flag and not its value. These options can be used multiple times to specify multiple INFO flags.自己理解下就好
3. 对vcf文件进行划窗处理:使用--window-pi和--window-pi-step参数,用户可以对vcf文件进行滑窗处理,统计每个自定义大小窗口内的变异位点数量和多态性pi值。4. 去除和保留vcf中指定样本:通过--keep和--remove参数,用户可以选择保留或删除特定样本的变异信息。5. 计算vcf文件的snp缺失率:使用--...
–remove-INFO<string> 根据ALLELE过滤 –maf <float> MAF最小值过滤 –max-maf <float> MAF最大值过滤 此处省去很多参数,具体参见vcftools官网 根据基因型数值过滤 –min-meanDP<float> –max-meanDP <float>根据测序深度进行过滤 –hwe<float> –max-missing <float>完整度,该参数介于0,1之间 ...