但AN和AC存在,可计算频率bcftools query -f'%CHROM %POS %AN %AC{0}\n'sample.vcf|\awk'{print...
bcftools query-f'%CHROM\t%POS\n'output.vcf.gz|shuf|head-n1000|sort-k1,1n-k2,2n>selected_snps.txt 这个命令的含义是,首先使用 bcftools query 选取输出文件中 SNP 位点的染色体和位置信息,然后使用 shuf 对行进行随机排序,接着使用 head 选取前 1000 行(即 1000 个 SNP 位点),最后使用 sort 对选定...
bcftools query-f'GQ:[ %GQ] \t GT:[ %GT]\n'file.vcf # 创建bed文件: chr, pos (0-based), end pos (1-based), id bcftools query-f'%CHROM\t%POS0\t%END\t%ID\n'file.bcf # 输出样本的突变位点信息和GT: bcftools query-f'[%CHROM:%POS %SAMPLE %GT\n]'-i'GT='alt''file.bcf...
query命令也是用于格式转换,和view命令不同,query通过表达式来指定输出格式,可定制化程度更高。用法如下 $ bcftools query-f'%CHROM\t%POS\t%REF\t%ALT[\t%SAMPLE=%GT]\n'view.vcf.gz -f参数通过一个表达式来指定输出格式,其中变量的写法如下 %CHROM 代表VCF文件中染色体那一列,其他的列,比如POS,ID,REF,AL...
Then you should be able to access the fields you are interested in as e.g. bcftools query -f ' %AC_non_v2_XX \n' The notation curly brackets notation (which is somewhat unfortunate as square brackets were already taken) is to take a specific value from a single tag. For example, if...
我在一个文件夹中有136个.vcf文件;我希望从每个文件中提取一些信息,并将输出写入一个.txt文件中,如下所示 [fi1d18@cyan01 snp]$ bcftools query -f '%CHROM\t%POS\t%REF\t%ALT[\t%ID]\n' file.vcf > file.txt 我是一个手动,但需要很长时间;谁能帮助我在任何脚本,以做所有的文件在Linux?谢谢 浏...
bcftools query 1.18 prints new lines when looping through samples. bcftools query's previous versions: $ bcftools query -f '[%TGT]\n' file.vcf A/C C/G G/T bcftools query's previous versions: $ bcftools query -f '[%TGT] ' file.vcf A/C C/G G/T bcftools query 1.18 $ bcftools...
解压vcf.gz(zcat) ,向vcf文件header增加contig信息(awk),将染色体按指定的映射关系重命名(bcftools annotate —rename-chrs )且仅挑选INFO/CLASS字段,按指定格式输出(bcftools query -f ),统计最后一列排序后输出频数 zcat ~/data/database/2021Q4/HGMD_Pro_2021.4_hg19.vcf.gz | \ awk ‘/^##contig/ {next...
bcftools view -i'GT="alt"' file.bcf -Ou | bcftools query -f'[%CHROM:%POS %SAMPLE %GT\n]' annotate: New -k, --keep-sites option consensus: Fix --iupac-codes output csq: Homs always considered phased and other fixes norm: Make-c nonework and removequery -c ...
第一步:bcftools query bcftools query -f '%ID\t%CHROM\t%POS[\t%TGT]\n' XXX.anno.vcf.gz > XXX_query.tab 第二步:替换——sed sed 's/chr//; s/\tM\t/\tMT\t/g; s/\///; s/\.\.$/--/; s/TA$/AT/; s/TC$/CT/; s/TG$/GT/; s/GA$/AG/; s/GC$/CG/; s/CA$/AC...