perl stat_mr_het_maf.pl output.hardy.txt>output_mr_het_maf.txt 3.设置过滤条件 filt.pl <>;while(<>){chomp;my@a=split/\s+/;if($a[2]<=0.05&&$a[3]<=0.1&&$a[4]>=0.1){print"$a[0]\t$a[1]\n";}} perl filt.pl output_mr_het_maf.txt>keep_snp_sites.txt 利用vcftools将kee...
Includes or excludes all sites with a specific INFO flag. These options only filter on the presence of the flag and not its value. These options can be used multiple times to specify multiple INFO flags.自己理解下就好 根据ALLELE过滤 –maf MAF最小值过滤 –max-maf MAF最大值过滤 此处省去很多...
--remove-filterer-allFILTER列除了PASS保留,其余都过滤 --keep-filtered,--remove-filtered保留或去除特定FILTER标签。可多次使用。 根据vcf第八列INFO进行过滤 --keep-INFO --remove-INFO根据INFO列的指定tag进行过滤 根据ALLEL进行过滤 --maf,--max-mafMinor Allele Frequency二等位基因频率进行过滤,常为--maf 0...
根据ALLELE过滤 –maf <float> MAF最小值过滤 –max-maf <float> MAF最大值过滤 此处省去很多参数,具体参见vcftools官网 根据基因型数值过滤 –min-meanDP<float> –max-meanDP <float>根据测序深度进行过滤 –hwe<float> –max-missing <float>完整度,该参数介于0,1之间 根据材料过滤 –indv –remove-indv...
--maf 0.05 ##[针对基因型进行过滤]次等位基因频率<0.05 --mac 3 ##[针对基因型进行过滤]过滤次要等位基因计数小于3的位点 --minQ 30 ##最低质量分数为30的位点 --freq ## 后面不加数字表示单纯计算输出等位基因频率,不是按照等位基因频率进行过滤 ...
6. vcftools在重测序中应用过滤实例 vcftools --gzvcf sample.vcf.gz --recode --recode-INFO-all --stdout\--maf 0.05 --max-missing 0.4 --minDP4--maxDP1000\--minQ30--minGQ80--min-alleles2--max-alleles2|gzip - > sample.clean.vcf.gz ...
nohup vcftools --gzvcf rice.raw.vcf.gz --recode --recode-INFO-all \ --stdout --maf 0.05 ...
这里不明白的参数--maf--max-maf通常会设置最小等位基因频率来过滤vcf文件,但这里设置最大等位基因频率是什么意思?--thin 1000 接下来计算两个不同群体的核苷酸多样性 获得两个不同群体所有的样本名,存入文件中 代码语言:javascript 代码运行次数:0 复制 ...
--maf 0.05\ ## 次等位基因频率不能低于0.05 --min-alleles 2\ ## 次等位基因个数 --max-alleles 2\ ## 主要等位基因个数 --keep test.line.txt\ ## 保留样本文件list --snps test.snps.txt\ ## 保留SNP文件list --recode --recode-INFO-all\ ##重新编码成vcf文件 ...
http://vcftools.sourceforge.net/downloads.html 进入压缩包目录,进行解压。检查安装是否成功 add id.pl拷贝至vcftools/bin目录下 add id.pl是一个老师写的脚本,这里不好直接放上来,所以需要添加id的话,请大家再去查找其他的教程,这里只是我自己做个备份。max-missing:分型完整度 maf:第二等位...