vcftools --vcf snp_indel.vcf --remove-indels --recode --recode-INFO-all --out SNPs_only # --remove-indels 移除indel位点信息,若想移除snp位点信息则用--keep-only-indels # --recode 这个参数和上面--freq的意思差不多,不能少,否则没有结果文件 # --recode-INFO-all,原vcf文件有一列为INFO,这里...
vcftools过滤变异类型 vcf文件中可能会同时是包含snp以及indel两种变异类型,如果想将其分开,可利用vcftools实现。 具体用法如下: 下图为原始vcf文件(raw.vcf),可以看到包含indel以及snp。 过滤掉indel,只保留snp--remove-indels。 执行以下命令: vcftools --remove-indels --recode --recode-INFO-all --vcf raw.vcf...
–remove-indels即保留或去除SNP,留下INDEL。 根据VCF文件第七列FILTER进行过滤 –remove-filterer-allFILTER列除了PASS保留,其余都过滤 –keep-filtered,–remove-filtered保留或去除特定FILTER标签。可多次使用。 根据vcf第八列INFO进行过滤 –keep-INFO –remove-INFO根据INFO列的指定tag进行过滤 根据ALLEL进行过滤 –...
2.从输入vcf文件输出新的vcf文件,该文件删除任何indel位点 vcftools--vcf input_file.vcf--remove-indels--recode--recode-INFO-all--outSNPs_only 3.输出文件比较两个vcf文件中的站点 vcftools --gzvcf input_file1.vcf.gz --gzdiff input_file2.vcf.gz --diff-site --out in1_v_in2 4.将新的vcf文...
–keep-only-indels 只保留indel标记 –remove-indels 删除indel标记 根据flag过滤 –remove-filtered-all Removes all sites with a FILTER flag other than PASS. –keep-filtered –remove-filtered ncludes or excludes all sites marked with a specific FILTER flag. These options may be used more than once...
–remove-indels 删除indel标记 根据flag过滤 –remove-filtered-all Removes all sites with a FILTER flag other than PASS. –keep-filtered –remove-filtered 根据INFO过滤 –keep-INFO<string> –remove-INFO<string> 根据ALLELE过滤 –maf <float> MAF最小值过滤 ...
vcftools可以随机抽取指定个样品的vcf文件,用到的选项为--max-indv,指定要从vcf文件中随机抽取指定个样品。 具体用法如下: 下图为原始vcf文件。 随机抽取5个样品,执行以下代码: vcftools --vcf snp.vcf --max-indv 5 --remove-indels --recode --out outfilename ...
--remove-indv 'Samplename' ###只删除一个样本 第二个需求,只提取其中的SNP,剔除indel --remove-indels ##若想移除snp位点信息则用--keep-only-indels ##有网友说 snp位点和indel的分离也可以用gatk,但我没用过 --positions specific_position.txt ...
--remove-indels \ ## 移除indel变异,保留SNP变异 --max-missing 0.5\ ## SNP样本缺失率不能超过50% ##(设置为1,代表完全不允许缺失;0.8代表允许20%缺失。) --maf 0.05\ ## 次等位基因频率不能低于0.05 --min-alleles 2\ ## 次等位基因个数 ...
vcftools--gzvcf Massoko_Dryad_VCF_final.vcf.gz--keep inds_to_keep.txt--stdout--recode--recode-INFO-all--remove-indels|bgzip>Massoko_Dryad_VCF_final_subset_noIndels.vcf.gz 为了减小计算压力,进一步对文件进行处理(这一步使用到的两个参数自己还不太明白是什么意思,这一步完全照搬原教程) ...