简并性
一个给定氨基酸有两个或两个以上密码子就是简并性(参见“遗传密码”条中遗传密码字典表)。由4种碱基以64个三联体为20种氨基酸编码,如果所有三联体都是有意义的密码子(代表一种氨基酸),这种编码法显然是简并的。现已知除UAA、UAG和UGA是无意义的密码子(终止密码),其他61个三联体都是氨基酸的密码子,因此遗传密码是极为简并的。61个密码子为20种氨基酸编码,平均每种氨基酸可有三个密码子;但实际上密码子的分配是非随机的。从遗传密码字典表上可看出一些规律。
1. 以XYN代表第一、二位碱基相同,第三位碱基不同(N表示任一碱基)的一组4个密码子,共计16个密码子组,其中有8组只为单独一种氨基酸编码: CUN(亮氨酸)、GUN (缬氨酸)、UCN(丝氨酸)、CCN (脯氨酸)、ACN(苏氨酸)、GCN(丙氨酸)、CGN (精氨酸)和GGN(甘氨酸)。只编码一种氨基酸的密码子组称为密码子族。
2.余下8对以嘧啶为第三位碱基的密码子XYU和X-YC总是为同一种氨基酸编码。UUUO (苯丙氨酸)、AUUO(异亮氨酸)、UAUO (酪氨酸)、CAUO (组氨酸)、AAUO(天冬酰胺)、GAUO(天冬氨酸)、UGUO(半胱氨酸)和AGUO(丝氨酸)。
3. 余下8对以嘌呤碱为末位碱基的密码子XYA和XYG多是为一种氨基酸编码:UUAG (亮氨酸)、CAAG(谷氨酰胺)、AAAG(赖氨酸)、GAAG(谷氨酸) 和AGAG (精氨酸)。甲硫氨酸和色氨酸在蛋白质中的含量比较少,都只有一个密码子,分别为AUG和UGG。另一对UAAG是终止密码子。
4. 编码同一氨基酸的密码子,其头两位碱基是相同的,但有三处例外:亮氨酸有CUN和UUAG,丝氨酸有U-CN和AGUO以及精氨酸有CGN和AGAG。
从遗传密码表还可见另一些规律。以U为其第二位碱基的密码子均代表疏水性氨基酸,而其中的亮氨酸、异亮氨酸和缬氨酸在结构上又极相近。具芳香环的苯丙氨酸(UUUO) 和酪氨酸(UAUO),其密码子只中间的碱基不同,而色氨酸的密码子也是以U起头的。谷氨酸和天冬氨酸这两种酸性氨基酸具有相似的密码子。丝氨酸和苏氨酸化学性质相近; 丝氨酸的6个密码子都可由一个碱基的替换而转变为苏氨酸密码子,虽然2个丝氨酸密码子和另4个丝氨酸密码子却有两个碱基不同。相近的氨基酸多少具有相关密码子。
从遗传密码表还可观察到,在蛋白质合成中,如果读错了密码子的第一或第二位碱基,就几乎总要造出错误的蛋白质,但读错了第三位碱基就未必如此; 对于密码子族,第三位碱基的错读毫不影响翻译的忠实性。实验表明,对于密码子族如缬氨酸或丙氨酸的,在密码子和反密码子相互作用中,密码子第三位碱基常错读,而对于非密码子族如赖氨酸或谷氨酰胺的,就不读错。从密码子反密码子相互作用的强弱上考虑,因为C和G配对有三个氢键,是强的,A和U配对只有二个氢键就弱。根据密码子头二位碱基和反密码子末二位碱基配对的情况,可有形成两对C:G的强型,形成两对A:U的弱型及形成一对C:G一对A:U的混合型。强型者的错读可能性最大,而弱型者最小。上举丙氨酸密码子族属强型,而赖氨酸密码子属弱型。仔细察看遗传密码表,可见所有强型密码子都是为同一氨基酸编码的密码子族,共有四族;而所有弱型密码子都没成为密码子族。这种分布特点正可避免由于错误而引起翻译失实。余下八组混合型密码子,有一半属于密码子族,都分布在表的左侧,而分布在表右侧的混合型密码子组都不成为密码子族。现悉在RNA双螺旋中,不仅碱基种类、而且碱基顺序也影响碱基的堆集:嘌呤-嘧啶的顺序和嘌呤-嘌呤顺序可有最好的堆集,而嘧啶-嘌呤顺序和嘧啶-嘧啶顺序则几无堆集作用。应用于tRNA,可按其反密码子1、2、3位碱基顺序分为有堆集型和无堆集型。而成为密码子族的混合型密码子,其所对应反密码子均属堆集型,即采嘌呤-嘧啶或嘌呤-嘌呤顺序;不成为密码子族的混合型密码子则不成密码子族。这种非随机的分布并非偶然所致,而是进化过程选择的结果,把第三位碱基误读而引起的翻译失实减至最小。