1.下载安装 cd ~/software/Purge_Dups git clone https://github.com/dfguan/purge_dups.git cd purge_dups/src && make 依赖软件 #kma git clone https://bitbucket.org/genomicepidemiology/kma.git cd kma && make #minimap2-三代比
# purge haplotigs and overlap~/opt/biosoft/purge_dups/bin/purge_dups-2-T cutoffs-c PB.base.covasm.split.self.paf.gz>dups.bed2>purge_dups.log dups.bed里的第四列就是每个contig的分类信息,分为"JUNK", "HIGHCOV", "HAPLOTIG", "PRIMARY", "REPEAT", "OVLP" 这6类,其中只有 purge_dups...
数据准备。 需要下载的数据集分为两个部分,一个是FALCON-Unzip后的primary contig 和 halplotigs. 另一个则是已经比完后的BAM文件 mkdir purge_haplotigs_tutorial cd purge_haplotigs_tutorial wget https://zenodo.org/record/841398/files/cns_h_ctg.fasta wget https://zenodo.org/record/841398/files/cns...
purge_dups能够根据read深度分析组装中haplotigs和overlaps。相对于另一款purge_haplotigs,它的运行速度更快,而且能够自动确定阈值。 purge_dups分为三个部分,第一部分是将序列回贴到基因组并分析覆盖度确定阈值,第二部分是将组装自我比对,第三部分是利用前两部分得到的信息鉴定到原来序列中的haplotigs和overlaps. 分...