根据k-mer的频数分布的主峰峰值判定k-mer的期望深度(即主峰对应的k-mer频数)。 根据k-mer的期望深度和k-mer的总数估计基因组大小。 根据低频k-mer估计数据错误率,并修正基因组大小的估计。 根据k-mer的其他峰估计k-mer的杂合度和重复序列比例。 2.3. k-mer原理 k-mer分析应用的前提假设是测序的reads是随机...
根据k-mer的频数分布的主峰峰值判定k-mer的期望深度(即主峰对应的k-mer频数)。 根据k-mer的期望深度和k-mer的总数估计基因组大小。 根据低频k-mer估计数据错误率,并修正基因组大小的估计。 根据k-mer的其他峰估计k-mer的杂合度和重复序列比例。 2.3. k-mer原理 k-mer分析应用的前提假设是测序的reads是随机...
根据k-mer的频数分布的主峰峰值判定k-mer的期望深度(即主峰对应的k-mer频数)。 根据k-mer的期望深度和k-mer的总数估计基因组大小。 根据低频k-mer估计数据错误率,并修正基因组大小的估计。 根据k-mer的其他峰估计k-mer的杂合度和重复序列比例。 2.3. k-mer原理 k-mer分析应用的前提假设是测序的reads是随机...
首先定义几个变量,方便解释原理:在不考虑测序错误、序列重复性和杂合序列的条件下,k-mer的深度分布遵循泊松分布。但实际情况是三者都存在,所以需要计算错误率,重复序列占比和杂合度,并根据计算结果修正对基因组大小的估计。在实际应用过程中,估计了基因组的错误率、杂合度和重复序列比例后,重新修正...
【推荐】用Smudgeplot评估物种倍性后,用组合jellyfish+GenomeScope1.0做二倍体物种的基因组调查,用组合KMC+GenomeScope2.0做多倍体物种的基因组调查。