
遗传密码是一组规则,将DNA或RNA序列以三个核苷酸为一组的密码子转译为蛋白质的氨基酸序列,以用于蛋白质合成。几乎所有的生物都使用同样的遗传密码,称为标准遗传密码;即使是非细胞结构的病毒,它们也是使用标准遗传密码。但是也有少数生物使用一些稍微不同的遗传密码。
目录 |
自从发现了DNA的结构,科学家便开始致力研究有关制造蛋白质的秘密。伽莫夫指出需要以三个核酸一组才能为20个氨基酸编码。1961年,美国国家卫生院的Matthaei与马歇尔·沃伦·尼伦伯格在无细胞系统(Cell-free system)环境下,把一条只由尿嘧啶(U)组成的RNA转释成一条只有苯丙氨酸(Phe)的多肽,由此破解了首个密码子(UUU -> Phe)。随后哈尔·葛宾·科拉纳破解了其它密码子,接着罗伯特·W·霍利发现了负责转录过程的tRNA。1968年,科拉纳、霍利和尼伦伯格分享了诺贝尔生理学或医学奖。
一个生物体携带的遗传信息-即基因组-被记录在DNA或RNA分子中,分子中每个有功能的单位被称作基因。每个基因均是由一连串单核苷酸组成。每个单核苷酸均由碱基,戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸三部分组成。碱基不同构成了不同的单核苷酸。组成DNA的碱基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的碱基以尿嘧啶(U)代替了胸腺嘧啶(T)。三个单核苷酸形成一组密码子,而每个密码子代表一个氨基酸或停止讯号。
制造蛋白质的过程中,基因先被从DNA转录为对应的RNA模板,即信使RNA(mRNA)。接下来在核糖体和转移RNA(tRNA)以及一些酶的作用下,由该RNA模板转译成为氨基酸组成的链(多肽),然后经过转译后修饰形成蛋白质。详情参阅转译。
因为密码子由三个核苷酸组成,故一共有43=64种密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码了代表了长度为3个氨基酸的一段蛋白质序列。(DNA也有类似的序列,但是以T代替了U)。
标准遗传密码如下表所示:由3个碱基对应到氨基酸的密码子表以及由氨基酸对应到3个碱基的反密码子表。
| 第二位碱基 | |||||
|---|---|---|---|---|---|
| U | C | A | G | ||
| 第 一 位 碱 基 |
U |
UUU (Phe/F)苯丙氨酸 |
|||
| C |
CAU (His/H)组氨酸 |
||||
| A |
AUU (Ile/I)异亮氨酸 |
AAU (Asn/N)天冬酰胺 |
|||
| G |
GAU (Asp/D)天冬氨酸 |
||||
1标准起始编码,同时为甲硫氨酸编码。mRNA中第一个AUG就是蛋白质翻译的起始部位。
此表列出了和20种氨基酸和密码子的标准配对。
| Ala | A | GCU, GCC, GCA, GCG | Leu | L | UUA, UUG, CUU, CUC, CUA, CUG |
| Arg | R | CGU, CGC, CGA, CGG, AGA, AGG | Lys | K | AAA, AAG |
| Asn | N | AAU, AAC | Met | M | AUG |
| Asp | D | GAU, GAC | Phe | F | UUU, UUC |
| Cys | C | UGU, UGC | Pro | P | CCU, CCC, CCA, CCG |
| Gln | Q | CAA, CAG | Ser | S | UCU, UCC, UCA, UCG, AGU, AGC |
| Glu | E | GAA, GAG | Thr | T | ACU, ACC, ACA, ACG |
| Gly | G | GGU, GGC, GGA, GGG | Trp | W | UGG |
| His | H | CAU, CAC | Tyr | Y | UAU, UAC |
| Ile | I | AUU, AUC, AUA | Val | V | GUU, GUC, GUA, GUG |
| 起始 | AUG | 终止 | UAG, UGA, UAA | ||
蛋白质的转译从初始化密码子(起始密码子)开始,但亦需要适当的初始化序列和起始因子才能使mRNA和核糖体结合。最常见的起始密码子为AUG(同时编码了甲硫氨酸),但在个别情况其它一些密码子也具有起始的功能。
在经典遗传学中,终止密码子各有名称:UAG为琥珀(amber),UGA为蛋白石(opal),UAA为赭石(ochre)。这些名称来源于最初发现到这些终止密码子的基因的名称。终止密码子使核糖体和释放因子结合,使多肽从核糖体分离而结束转译的程序。
大部分密码子具有简并性,即两个或者多个密码子编码同一氨基酸。简并的密码子通常只有第三位碱基不同,例如,GAA和GAG都编码谷氨酰胺。如果不管密码子的第三位为哪种核苷酸,都编码同一种氨基酸,则称之为四重简并;如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为二重简并,一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是起始密码子;另一个是色氨酸,由UGG编码。
遗传密码的这些性质可使基因更加耐受点突变。例如,四重简并密码子可以容忍密码子第三位的任何变异;二重简并密码子使三分之一可能的第三位的变异不影响蛋白质序列。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大,因此二重简并密码子也具有很强的对抗突变的能力。不影响氨基酸序列的突变称为沉默突变。
简并性的出现是由于tRNA反密码子的第一位碱基可以和mRNA构成摆动碱基对,常见的情况为反密码子上的次黄嘌呤(I),以及和密码子形成非标准的U-G配对。
另一种有助对抗点突变的情况,是NUN (N代表任何核苷酸) 倾向于代表疏水性氨基酸,故此即使出现突变,仍有较大机会维持蛋白质的亲水度,减低致命破坏的可能。
“密码子”是由阅读的起始位点决定的。例如,一段序列GGGAAACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个阅读框,每个都能产生不同的氨基酸序列(在上例中,相应为Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因为DNA的双螺旋结构,每段DNA实际上有六个阅读框。 实际的框架是由起始密码子确定,通常是mRNA序列上第一个出现的AUG。
破坏阅读框架的变异(例如,插入或删除1个或2个核苷酸)称为阅读框变异,通常会严重影响到蛋白质的功能,故此并不常见,因为他们通常不能在演化中存活下来。
虽然遗传密码在不同生命之间有很强的一致性,但亦存在非标准的遗传密码。在有“细胞能量工厂”之称的线粒体中,便有和标准遗传密码数个相异的之处,甚至不同生物的线粒体有不同的遗传密码。支原体会把UGA转译为色氨酸。纤毛虫则把UAG(有时候还有UAA)转译为谷氨醘胺(一些绿藻也有同样现象),或把UGA转译为半胱氨酸。一些念珠菌属酵母会把CUG转译为丝氨酸。在一些罕见情况,一些蛋白质会有AUG以外的起始密码子。
按信使RNA的序列,在一些蛋白质里停止密码子会被翻译成非标准的氨基酸,例如UGA转译为硒半胱胺酸和UAG转译为吡咯赖胺酸,随着对基因组序列加深了解,科学家可能还会发现其它非标准的转译方式,以及其它未知氨基酸在生物中的应用。
除了少数的不同之外,地球上已知生物的遗传密码均非常接近;因此根据演化论,遗传密码应在生命历史中很早期就出现。现有的证据表明遗传密码的设定并非是随机的结果,对此有以下的可能解释1:
网络上有很多有关本题目的资料,由美国国家卫生院提供NCBI Bookshelf。
Why are we here?
All text is available under the terms of the GNU Free Documentation License
This page is cache of Wikipedia. History