vcftools --vcf test.vcf --chr chr1 --from-bp 1000000 --to-bp 2000000 --recode --stdout | less vcftools --vcf test.vcf --chr chr1 --from-bp 1000000 --to-bp 2000000 --recode -c > ../subset.vcf vcftools --vcf test.vcf --chr chr1 --from-bp 1000000 --to-bp 2000000 --reco...
首先我的第一个需求,从vcf中提取部分Sample vcftools --vcf in.vcf --recode --recode-INFO-all --stdout --keep id.txt > out.vcf 其中: --vcf vcf文件名 ##如果是压缩文件vcf.gz的话,需要改成 --gzvcf vcf.gz的文件名 --recode ##不想报错,这句话就不能省略 --recode-INFO-all ##保留旧vcf...
现在我们有一个要删除的个体列表,我们可以直接将其提供给VCFtools进行过滤。 vcftools --vcf raw.g5mac3dp3.recode.vcf --remove lowDP.indv --recode --recode-INFO-all --out raw.g5mac3dplm 然后该文章的原作者非常贴心的, 我们可以将变异限制为在高百分比的个体中,并通过基因型的平均深度进行过滤。 vc...
利用vcftools将keep_snp_sites.txt文件中位点取出 vcftools--gzvcf output.vcf.gz--positions keep_snp_sites.txt--recode--recode-INFO-all--out final_out 这一步也可以运用bcftools view的-R参数进行。 可以将这些脚本与命令行整合到一个脚本中,filt_vcf.pl: system"bcftools view -m2 -M2 -v snps $ARGV...
vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和--remove-indv,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。 具体用法如下: 只保留1和10号两个样品,执行以下代码: vcftools--vcfin.vcf--recode--recode-INFO-all--stdout--indv1--indv10> out.vcf ...
vcftools --vcf filter_snp_indel.vcf --remove-filtered-all --recode --recode-INFO-all --out pass_snp_indel 进行了过滤标记的文件(filter_snp_indel.vcf) 5,为每个位点输出Hardy-Weinberg p值 vcftools --vcf all.SNP.vcf --hardy --max-missing 1.0 --out all_snp_hardy ...
--recode-INFO-all:在重新编码的VCF文件中包含所有INFO字段。 5. 检查输出文件 运行完命令后,检查生成的输出文件(如output.vcf),确认指定位置的SNP已被正确提取。 示例位置文件(positions.txt) text 1:123456 2:654321 X:789012 示例VCF文件(data.vcf.gz的部分内容,解压后) vcf #CHROM POS ID REF ALT QUAL...
vcf 文件中很多snp在某些样品中是缺失的,也就是基因型为 "./." 。如果缺失率较高,这种snp位点在很多分析中是不能用的,需要去掉。这时候就可以使用vcftools进行过滤。用到的选项为--max-missing。 具体用法如下: 运行以下命令: vcftools--vcfsnp.vcf--recode--recode-INFO-all--stdout--max-missing1> snp....
–gzvcf:处理压缩格式的vcf文件(可替换为–vcf) –chr n:选择染色体n,例:–chr 1 –recode:重新编码为vcf文件,有过滤操作都要加上--recode –recode-INFO-all:将输出的文件保存所有INFO信息 –stdout:标准输出,后接管道命令 –gzip -c:压缩 output.vcf.gz:将结果输出到output.vcf.gz ...
–gzvcf:处理压缩格式的vcf文件(可替换为–vcf)–chr n:选择染色体n,例:–chr 1 –recode:重新编码为vcf文件,有过滤操作都要加上--recode –recode-INFO-all:将输出的文件保存所有INFO信息 –stdout:标准输出,后接管道命令 –gzip -c:压缩 --max-missing --max-missing的取值是0-1,...