isec用于在多个VCF文件之间取交集,差集,并集等操作,经典的应用场景是对多种软件的SNP calling 结果进行venn 分析。用法如下 代码语言:javascript 代码运行次数:0 运行 AI代码解释 bcftools isec A.vcf.gz B.vcf.gz -p dir 默认参数就是取交集,更多高级用法请参考帮助文档。 5. stats stats命令用于统计VCF文件的...
取交集(需要取交集的文件需要预先排序并建索引) bcftools isec /bi/8.xuxiong/EQA2022/20221019/All.sp.nonHomo.vcf.gz /bi/8.xuxiong/database/ClinVar.HGMD.Local.SpliceAI.whitelist.V20211010.vcf.gz -n =2 -w 1 -Ov | less -S 取并集,需两个vcf均有索引,且排序(需要合并的文件需要预先排序并建...
该命令要求输入文件必须是经过bgzip压缩的文件, 而且还需要有.tbi的索引。 4. isec isec用于在多个VCF文件之间取交集,差集,并集等操作,经典的应用场景是对多种软件的SNP calling 结果进行venn 分析。用法如下 bcftools isec A.vcf.gz B.vcf.gz -p dir 1. ...
5. bcftools isec 求变异的交集、并集 # 求交集 bcftools isec -p dir A.vcf.gz B.vcf.gz # 并集 bcftools isec -p dir -n=2 -w1 A.vcf.gz B.vcf.gz # 差集 bcftools isec -p dir -n-1 -c all A.vcf.gz B.vcf.gz dir:输出文件夹 -c:选择变异类型进行处理 -C:求第一个文件有其他文件...
bcftools isec A.vcf.gz B.vcf.gz -p dir 默认参数就是取交集,更多高级用法请参考帮助文档。 5. stats stats命令用于统计VCF文件的基本信息,比如突变位点的总数,不同类型突变位点的个数等。用法如下 bcftools stats view.vcf > view.stats 输出文件中记录了很多类型的统计数据,重点介绍以下几种 ...
bcftools isec A.vcf.gz B.vcf.gz -p dir 默认参数就是取交集,更多高级用法请参考帮助文档。 5. stats stats命令用于统计VCF文件的基本信息,比如突变位点的总数,不同类型突变位点的个数等。用法如下 bcftools stats view.vcf > view.stats 输出文件中记录了很多类型的统计数据,重点介绍以下几种 ...
包括对VCF文件进行格式转换,过滤,排序,取交集等功能,涉及到的子命令如下 annotate concat convert isec merge norm plugin query reheader sort view 3. 对VCF/BCF 建立索引 对应的子命令为index bcftools 是C语言开发的,所以处理速度非常快,可以看做是VCFtools 的升级版本。
包括对VCF文件进行格式转换,过滤,排序,取交集等功能,涉及到的子命令如下 annotate concat convert isec merge norm plugin query reheader sort view 3. 对VCF/BCF 建立索引 对应的子命令为index bcftools 是C语言开发的,所以处理速度非常快,可以看做是VCFtools 的升级版本。
4、bcftools isec 计算不同vcf之间的突变的交集 这里假设有3个文件,分别是 Breast_1.vcf.gz, Breast_2.vcf.gz和 Breast_3.vcf.gz,我们想知道每一个突变在这3个样本中是否出现 #-n+1:在3个样本中至少出现一次突变的样本 bcftools isec -n+1 -c all -p merge Breast_1.vcf.gz Breast_2.vcf.gz Brea...
bcftools isec 示例:# 创建两个文件的交集和补集将其保存在 dir文件夹bcftools isec -p dir A.vcf.gz B.vcf.gz # 对A文件(INFO/MAF>=0.01)和B文件(INFO/dbSNP)进行过滤,但不对C文件进行过滤;在 dir 文件夹生成 3 个文件的交集位点,这些位点至少在 2 个输入文件中出现 bcftools isec -e'MAF<0.01' ...