遗传密码


遗传密码 (正體)

Free Web Hosting with Website Builder
RNA分子上一系列的密码子,每个密码子包括三个核苷酸,代表一个氨基酸

遗传密码是一组规则,将DNARNA序列以三个核苷酸为一组的密码子转译蛋白质氨基酸序列,以用于蛋白质合成。几乎所有的生物都使用同样的遗传密码,称为标准遗传密码;即使是非细胞结构的病毒,它们也是使用标准遗传密码。但是也有少数生物使用一些稍微不同的遗传密码。

目录

破解历史

自从发现了DNA的结构,科学家便开始致力研究有关制造蛋白质的秘密。伽莫夫指出需要以三个核酸一组才能为20个氨基酸编码。1961年美国国家卫生院的Matthaei与马歇尔·沃伦·尼伦伯格在无细胞系统(Cell-free system)环境下,把一条只由尿嘧啶(U)组成的RNA转释成一条只有苯丙氨酸(Phe)的多肽,由此破解了首个密码子(UUU -> Phe)。随后哈尔·葛宾·科拉纳破解了其它密码子,接着罗伯特·W·霍利发现了负责转录过程的tRNA1968年,科拉纳、霍利和尼伦伯格分享了诺贝尔生理学或医学奖

基因组的表达

一个生物体携带的遗传信息-即基因组-被记录在DNA或RNA分子中,分子中每个有功能的单位被称作基因。每个基因均是由一连串单核苷酸组成。每个单核苷酸均由碱基戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸三部分组成。碱基不同构成了不同的单核苷酸。组成DNA的碱基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的碱基以尿嘧啶(U)代替了胸腺嘧啶(T)。三个单核苷酸形成一组密码子,而每个密码子代表一个氨基酸或停止讯号。

制造蛋白质的过程中,基因先被从DNA转录为对应的RNA模板,即信使RNA(mRNA)。接下来在核糖体转移RNA(tRNA)以及一些的作用下,由该RNA模板转译成为氨基酸组成的链(多肽),然后经过转译后修饰形成蛋白质。详情参阅转译

因为密码子由三个核苷酸组成,故一共有43=64种密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码了代表了长度为3个氨基酸的一段蛋白质序列。(DNA也有类似的序列,但是以T代替了U)。

标准遗传密码如下表所示:由3个碱基对应到氨基酸的密码子表以及由氨基酸对应到3个碱基的反密码子表。

表一:密码子表

此表列出了64种密码子以及氨基酸的标准配对。
第二位碱基
U C A G




U

UUU (Phe/F)苯丙氨酸
UUC (Phe/F)苯丙氨酸
UUA (Leu/L)亮氨酸
UUG (Leu/L)亮氨酸

UCU (Ser/S)丝氨酸
UCC (Ser/S)丝氨酸
UCA (Ser/S)丝氨酸
UCG (Ser/S)丝氨酸

UAU (Tyr/Y)酪氨酸
UAC (Tyr/Y)酪氨酸
UAA 终止
UAG 终止

UGU (Cys/C)半胱氨酸
UGC (Cys/C)半胱氨酸
UGA 终止
UGG (Trp/W)色氨酸

C

CUU (Leu/L)亮氨酸
CUC (Leu/L)亮氨酸
CUA (Leu/L)亮氨酸
CUG (Leu/L)亮氨酸

CCU (Pro/P)脯氨酸
CCC (Pro/P)脯氨酸
CCA (Pro/P)脯氨酸
CCG (Pro/P)脯氨酸

CAU (His/H)组氨酸
CAC (His/H)组氨酸
CAA (Gln/Q)谷氨酰胺
CAG (Gln/Q)谷氨酰胺

CGU (Arg/R)精氨酸
CGC (Arg/R)精氨酸
CGA (Arg/R)精氨酸
CGG (Arg/R)精氨酸

A

AUU (Ile/I)异亮氨酸
AUC (Ile/I)异亮氨酸
AUA (Ile/I)异亮氨酸
AUG (Met/M)甲硫氨酸, 起始1

ACU (Thr/T)苏氨酸
ACC (Thr/T)苏氨酸
ACA (Thr/T)苏氨酸
ACG (Thr/T)苏氨酸

AAU (Asn/N)天冬酰胺
AAC (Asn/N)天冬酰胺
AAA (Lys/K)赖氨酸
AAG (Lys/K)赖氨酸

AGU (Ser/S)丝氨酸
AGC (Ser/S)丝氨酸
AGA (Arg/R)精氨酸
AGG (Arg/R)精氨酸

G

GUU (Val/V)缬氨酸
GUC (Val/V)缬氨酸
GUA (Val/V)缬氨酸
GUG (Val/V)缬氨酸

GCU (Ala/A)丙氨酸
GCC (Ala/A)丙氨酸
GCA (Ala/A)丙氨酸
GCG (Ala/A)丙氨酸

GAU (Asp/D)天冬氨酸
GAC (Asp/D)天冬氨酸
GAA (Glu/E)谷氨酸
GAG (Glu/E)谷氨酸

GGU (Gly/G)甘氨酸
GGC (Gly/G)甘氨酸
GGA (Gly/G)甘氨酸
GGG (Gly/G)甘氨酸

1标准起始编码,同时为甲硫氨酸编码。mRNA中第一个AUG就是蛋白质翻译的起始部位。

表二:逆密码子表

此表列出了和20种氨基酸和密码子的标准配对。

Ala A GCU, GCC, GCA, GCG Leu L UUA, UUG, CUU, CUC, CUA, CUG
Arg R CGU, CGC, CGA, CGG, AGA, AGG Lys K AAA, AAG
Asn N AAU, AAC Met M AUG
Asp D GAU, GAC Phe F UUU, UUC
Cys C UGU, UGC Pro P CCU, CCC, CCA, CCG
Gln Q CAA, CAG Ser S UCU, UCC, UCA, UCG, AGU, AGC
Glu E GAA, GAG Thr T ACU, ACC, ACA, ACG
Gly G GGU, GGC, GGA, GGG Trp W UGG
His H CAU, CAC Tyr Y UAU, UAC
Ile I AUU, AUC, AUA Val V GUU, GUC, GUA, GUG
起始 AUG 终止 UAG, UGA, UAA

技术细节

起始和终止密码子

蛋白质的转译从初始化密码子(起始密码子)开始,但亦需要适当的初始化序列和起始因子才能使mRNA和核糖体结合。最常见的起始密码子为AUG(同时编码了甲硫氨酸),但在个别情况其它一些密码子也具有起始的功能。

在经典遗传学中,终止密码子各有名称:UAG为琥珀(amber),UGA为蛋白石(opal),UAA为赭石(ochre)。这些名称来源于最初发现到这些终止密码子的基因的名称。终止密码子使核糖体和释放因子结合,使多肽核糖体分离而结束转译的程序。

简并性

大部分密码子具有简并性,即两个或者多个密码子编码同一氨基酸。简并的密码子通常只有第三位碱基不同,例如,GAA和GAG都编码谷氨酰胺。如果不管密码子的第三位为哪种核苷酸,都编码同一种氨基酸,则称之为四重简并;如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为二重简并,一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是起始密码子;另一个是色氨酸,由UGG编码。

遗传密码的这些性质可使基因更加耐受点突变。例如,四重简并密码子可以容忍密码子第三位的任何变异;二重简并密码子使三分之一可能的第三位的变异不影响蛋白质序列。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大,因此二重简并密码子也具有很强的对抗突变的能力。不影响氨基酸序列的突变称为沉默突变。

简并性的出现是由于tRNA反密码子的第一位碱基可以和mRNA构成摆动碱基对,常见的情况为反密码子上的次黄嘌呤(I),以及和密码子形成非标准的U-G配对。

另一种有助对抗点突变的情况,是NUN (N代表任何核苷酸) 倾向于代表疏水性氨基酸,故此即使出现突变,仍有较大机会维持蛋白质的亲水度,减低致命破坏的可能。

阅读框

“密码子”是由阅读的起始位点决定的。例如,一段序列GGGAAACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个阅读框,每个都能产生不同的氨基酸序列(在上例中,相应为Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因为DNA的双螺旋结构,每段DNA实际上有六个阅读框。 实际的框架是由起始密码子确定,通常是mRNA序列上第一个出现的AUG。

破坏阅读框架的变异(例如,插入或删除1个或2个核苷酸)称为阅读框变异,通常会严重影响到蛋白质的功能,故此并不常见,因为他们通常不能在演化中存活下来。

非标准的遗传密码

虽然遗传密码在不同生命之间有很强的一致性,但亦存在非标准的遗传密码。在有“细胞能量工厂”之称的线粒体中,便有和标准遗传密码数个相异的之处,甚至不同生物的线粒体有不同的遗传密码。支原体会把UGA转译为色氨酸。纤毛虫则把UAG(有时候还有UAA)转译为谷氨醘胺(一些绿藻也有同样现象),或把UGA转译为半胱氨酸。一些念珠菌属酵母会把CUG转译为丝氨酸。在一些罕见情况,一些蛋白质会有AUG以外的起始密码子。

按信使RNA的序列,在一些蛋白质里停止密码子会被翻译成非标准的氨基酸,例如UGA转译为硒半胱胺酸和UAG转译为吡咯赖胺酸,随着对基因组序列加深了解,科学家可能还会发现其它非标准的转译方式,以及其它未知氨基酸在生物中的应用。

遗传密码的起源

除了少数的不同之外,地球上已知生物的遗传密码均非常接近;因此根据演化论,遗传密码应在生命历史中很早期就出现。现有的证据表明遗传密码的设定并非是随机的结果,对此有以下的可能解释1:

  • 最近一项研究显示,一些氨基酸与它们相对应的密码子有选择性的化学结合力2,这显示现在复杂的蛋白质制造过程可能并非一早存在,最初的蛋白质可能是直接在核酸上形成。
  • 原始的遗传密码可能比今天简单得多,随着生命演化制造出新的氨基酸再被利用而令遗传密码变得复杂。虽然不少证据证明这观点3,但详细的演化过程仍在探索之中4,5

参考资料

其它参考资料

网络上有很多有关本题目的资料,由美国国家卫生院提供NCBI Bookshelf

相关条目

外部链接







Why are we here?
All text is available under the terms of the GNU Free Documentation License
This page is cache of Wikipedia. History