虽然作者说差别应该不会很大,但实际上我之前的结果,一个组装版本的N50是28 Mb,另一个是26 Mb,感觉也不算是很小的差别。 根据作者的介绍,在选择任意一个reads都可以进行组装的情况下,hifiasm会选择ID号更小的那个,那是否意味着我们可以把所有的reads组成一个文件然后根据长度逆向排序后重新赋予ID呢?当然这只是我拍脑袋想到的,没有经
一般来说,用hifiasm组装基因组,纯合材料用- l0,非纯系材料,比如我们做园艺果树的,尽量是希望分出来两个单倍型,所以参数-l3,当然,分出两个单倍型,是默认参数,所以默认可以不设置。 两个模式大体输出结果如下图: 可以看出来,区别在于前者多输出了一个a_ctg而后者则多输出了hap1.p_ctg和hap2.p_ctg 逻辑上,看...
对于人类基因组,hifiasm也能取得最好的效果。相比于现有算法,hifiasm所产生的组装结果连续性最高,同时也正确解析了最多的复杂和高重复区域,如MHC (主要组织相容性复合体)和centromere (着丝端粒)。尤其对于人类二倍体样本HG002和HG00733,hifiasm产生的组装结果的连续性3倍于其他算法,并成功保留了最多的变异信息。