单拷贝基因与重复序列
在真核细胞的基因组中,例如人体,有60%的序列是由单拷贝基因组成的,这些基因,在每个基因组中只有一两个拷贝,它们的序列都是专一的。很多结构蛋白的基因,例如白蛋白、珠蛋白的基因都是单拷贝的。另外40%基因组的序列是重复序列。可分为两类,每个基因组中的拷贝数从10至105个,称为中等重复序列,约占30%,如rRNA、tRNA、组蛋白和免疫球蛋白的基因等。另一类每个基因组中的拷贝数在10
以上,称为高重复序列, 约占10%。这部分序列比较简单也不被转录,可能与基因表达的调控有关。它们多定位在染色体的着丝点。
重复序列中还有一类是通过限制性内切酶测出和定名的,目前已确定有Alu、Hinf和EcoR I族三种重复序列。Alu族重复序列长度约300 bp,有3×105拷贝分散地随机排布在基因组DNA中。而Hinf和EcoR1 族重复序列是由两个亚单位组成的300个碱基对(bp)的重复体,它们在基因组中的排布不是随机的。