线性重复序列以线性排列方式分布在基因组中,通常由简单序列单元重复构成,例如端粒区域的重复序列,对染色体末端的保护至关重要。散在重复序列分散于基因组不同区域,如转座子(如Alu序列),可通过“复制-粘贴”或“剪切-粘贴”机制移动,促进基因组的动态变化。串联重复序列由短序列单元首尾相连重复形成...
重复[DNA]序列 重复[DNA]序列是2007年公布的遗传学名词。定义 DNA分子中重复出现的核苷酸序列。出处 《遗传学名词》。
单一DNA:真核生物基因组中只有一个复制的DNA序列,不属于重复序列的范畴,但在此提及以作对比。高度重复序列:由较短的序列以10^510^7次直线连接而成,包括随体DNA等。中等程度重复序列:包含大约300500个核苷对的相似序列,如哺乳类DNA中的AluI家族序列,其出现频率高达10^5次。组织形式:串联重复序列...
简单重复序列(Simple Sequence Repeat, SSR),又称微卫星序列,指基因组中由1-6个核苷酸组成的串联重复序列,如CACACA……,广泛分布在各种真核生物基因组中。 原理: 微卫星的突变率在不同物种、同一物种的不同位点或同一位点的不同等位基因...
反向重复序列指两个序列相同的拷贝在DNA链上呈反向排列, 是DNA重复序列的一种类型。反向重复序列散布在整个基因组中,约占人类基因组中占5%,常见于基因的调控区,可能与基因的转录、复制有关。反向重复序列的一种形式是反向排列的两个拷贝间隔着一段序列,另一种 形式是两个拷贝之间没有间隔序列,呈反向串联,...
1. 重复序列注释 重复序列占基因组非常高的比例,对重复序列的注释一般是做基因组注释的第一步。常用的基因组重复序列注释软件有RepeatMasker, RepeatModeler, EDTA。 转座子(transposable elements,TE)是可以在基因组内改变位置的一段DNA序列,通常由DNA复制造成,TE是基因组的重要组成部分。 2. RepeatMasker 2.1. Repea...
长末端重复序列(LTR)是反转录病毒的基因组的两端各有一个长末端重复序列(5'—LTR和3'—LTR)。序列介绍 不编码蛋白质,但含有启动子,增强子等调控元件,病毒基因组内的LTR可转移到细胞原癌基因邻近处,使这些原癌基因在LTR强启动子和增强子的作用下被激活,将正常细胞转化为癌细胞。长末端重复序列(long ...
所谓Dup,即重复序列Duplicate reads,这些重复序列在总测序序列中占比简称为Dup rate。由于这些重复序列不能带来额外信息,相反会影响变异检测结果准确性,因此下游生信分析中这些重复序列是需要去除的去掉,这也就意味着Dup rate越高,数据利用率越低,测序成本浪费的也就越多。因此在NGS生信分析中首要了解的就是dup rate的...
这些重复序列可以是短的小片段,如微卫星或简单序列重复(SSR),也可以是长的片段,如转座子或长散在重复序列(LINEs)。 有关“重复序列鉴定”的方法介绍如下: 1.基本局部搜索算法:这种方法用于检测DNA序列中的重复序列。它从给定的起始位置开始,搜索与已找到的重复序列相似的子序列。 2.多序列比对:这是通过将多个...