**章基因组测序技术的发展及其应用
**节基因组测序技术的发展
一、基因组测序技术发展历程中的关键事件
从 40多年前几个千碱基( kilobase,kb)的 DNA片段测序开始,基因组测序技术得到了快速发展,现在可以实现对数百万人和无数其他物种的基因组进行测序,人们预言:从长远来看,基因组测序给生命科学带来的影响将与显微镜的影响一样巨大(Shendure et al.,2017)。根据 Shendure等(2017)报道的相关内容,表 1-1-1整理、补充了基因组测序技术发展历程中的一些关键事件。
表 1-1-1 基因组测序技术发展历程中的一些关键事件
续表
注:“/”表示无相关文献
二、早期的生物大分子测序技术
(一)蛋白质序列测定
科学家相信生物大分子( DNA、RNA、蛋白质等)的化学结构与其生物功能密切相关,因此他们对测定其一级序列结构具有浓厚的兴趣。对蛋白质和 RNA的序列测定早于 DNA。
1949年,埃德曼降解法( Edman degradation)创立,从肽链氨基端( N端)依次对氨基酸进行鉴定,分为耦合、切割、萃取、转化、鉴定等几个步骤( Edman,1949)。*先,在 pH 9.0的碱性环境下,将异硫氰酸苯酯( Ph—N== C== S,PITC)与蛋白质或多肽 N端氨基酸耦合,形成苯氨基硫甲酰( PTC)衍生物;然后,利用三氟乙酸( TFA)处理耦合后产物,将多肽或蛋白质的 N端**个肽键选择性切断,释放出该氨基酸残基的噻唑啉酮苯胺衍生物;随后萃取出释放的氨基酸衍生物并在强酸性条件下将其转化为稳定的乙内酰苯硫脲氨基酸( PTH-氨基酸);昀后,利用色谱法鉴定出降解的 PTH-氨基酸种类,从而得到蛋白质或多肽 N端序列信息。埃德曼降解法的优点是异硫氰酸苯酯与所有氨基酸残基的反应产率和回收率都相当高,因此反应副产物少,采用色谱法可以准确鉴定。另外,对大多数氨基酸残基而言,30 min的耦合反应时间、5 min的切割反应时间都已足够,因此,极大地推动了蛋白质序列测定工作。 1953年,Sanger和 Thompson测定了**个蛋白质——牛胰岛素的一级序列结构,他将胰岛素的两条链分成若干片段,分别测定各片段的序列,然后将各片段组装成完整序列。因为这一成就,他获得了 1958年诺贝尔化学奖。 1960年,希尔什( Hirs)等完成了**个酶 ——核糖核酸酶的氨基酸序列测定。
(二)RNA序列测定
1. 非放射性同位素标记的 RNA序列测定
1965年,霍利( Holley)等测定了**个 RNA——酵母丙氨酸-tRNA的一级结构。他们通过逆流色谱法从酵母中纯化丙氨酸 -tRNA,并测定其碱基组成;先后用核酸内切酶——牛胰 RNase I(endoribonuclease I)和高峰氏淀粉酶 RNase T1(taka-diastase RNase T1,专一水解鸟苷酸二酯键产生 3′-GMP或以 3′-GMP为末端的寡核苷酸)分别在 DEAE葡聚糖凝胶(DEAE-Sephadex)和 DEAE纤维素(DEAE-cellulose)层析柱中酶切,并经层析和纸电泳分离各寡核苷酸片段;用蛇毒磷酸二酯酶( snake venom phosphodi-esterase)消化和纸电泳或双向纸层析分析各片段的 5′-核苷酸;昀后,通过不同片段的核苷酸序列和各片段的相互重叠关系,获得完整的一级序列( Holley et al.,1965b)。当时,他们 5人工作 3年,从 140 kg酵母中纯化出 1 g丙氨酸 -tRNA,才能满足全长 76个核苷酸的丙氨酸-tRNA的测定需要(Holley et al.,1965a)。
2. 放射性同位素标记的指纹分析法
就在同一年,Sanger等(1965)报道了基于放射性同位素标记和双向聚丙烯酰胺凝胶电泳技术的指纹分析(fingerprinting)方法,大大简化了 RNA序列测定过程。此后, RNA一级结构的测定得到了迅速的发展,先后完成了多个物种不同氨基酸的转运 RNA
(tRNA)一级结构测定工作,如酵母的酪氨酸-tRNA(Madison et al.,1966)、赖氨酸 -tRNA(Smith et al.,1971,1973)、半胱氨酸 -tRNA(Holness and Atfield,1976)、亮氨酸 -tRNA(Kowalski et al.,1971;Murasugi and Takemura,1978)、苯丙氨酸 -tRNA(McCutchan et al.,1978);大肠杆菌的酪氨酸 -tRNA(Doctor et al.,1969)、异丝氨酸-tRNA(Ish-Horowicz and Clark,1973)、亮氨酸 -tRNA(Harada and Nishimura,1974)、苏氨酸 -tRNA(Clarke and Carbon,1974)、谷氨酰胺 -tRNA(Yaniv and Folk,1975)、甘氨酸-tRNA和丝氨酸-tRNA(Chang and Carbon,1975)、半胱氨酸-tRNA(Mazzara and McClain,1977);葡萄球菌的甘氨酸-tRNA(Roberts,1974)、异亮氨酸 -tRNA(Kuchino et al.,1980);沙门氏菌的组氨酸-tRNA(Singer and Smith,1972);人的甘氨酸 -tRNA(Gupta et al.,1980);大鼠的丝氨酸-tRNA(Müller et al.,1971);果蝇的 5个丝氨酸-tRNA(White et al.,1975);小麦的起始甲硫氨酸-tRNA(Ghosh et al.,1974);病毒的甲硫氨酸 -tRNA(Elder and Smith, 1973)、甘氨酸 -tRNA(Barrell et al.,1973)亮氨酸-tRNA(Pinkerton et al.,1974)、精氨酸-tRNA(Mazzara et al.,1977)、苏氨酸 -tRNA(Guthrie et al.,1978)。值得一提的是,1976年菲耶尔( Fiers)等完成了**个 RNA噬菌体 MS2的完整 RNA基因组的测序。到 20世纪 80年代,已经完成的不同物种来源和转运不同氨基酸的 tRNA一级结构的测定超过 280种,5S RNA为 175种,5.8S RNA也有几十种,还有许多 16S rRNA、 18S rRNA、23S rRNA和 26S rRNA的一级结构被测定(Wild and Sommer,1980;Kobayashi et al.,1981;Chao et al.,1984)。
(三)早期的 DNA序列测定技术
1. 引物延伸法
昀早报道的 DNA序列是 12 bp的 λ噬菌体( lambda bacteriophage)黏端 DNA序列,获得该序列的方法是引物延伸( primer extension)法( Wu and Kaiser,1968;Wu,1972),所用到的 DNA聚合酶合成和核苷酸特异性标记策略在现代 DNA测序技术中得到沿用。 Gilbert和 Maxam(1973)通过脱氧核糖核酸酶( DNase)酶切而获得乳糖操纵子( lac operator)中受 lac抑制子( lac repressor)保护的 27 bp的启动子片段,转录成 RNA后进行序列测定,历时 2年昀终获得 24 bp的 DNA序列(相当于每个月测定 1个碱基),该序列中含有反向互补的回文结构:
2. 酶法
1974年,Sanger等*次建立了酶法 DNA序列测定技术,对 f1噬菌体的 1个长度为 81个核苷酸的片段进行了序列测定,以 8个碱基( ACCATCCA)的寡核苷酸为引物,利用 DNA聚合酶扩增,扩增时,dNTP底物中有 1个(dCTP或 dGTP)被相应的核糖核苷酸( rCTP或 rGTP)替代,扩增产物用合适的核糖核酸酶在 rCTP或 rGTP位点特异性切割,然后进行双向电泳而获得序列信息。
3. 加减法
在此基础上,Sanger和 Coulson(1975)建立了加减法( plus and minus method)序列测定技术,包括采用特异引物在 DNA聚合酶作用下进行延伸反应、碱基特异性的链终止,以及采用聚丙烯酰胺凝胶电泳区分长度差一个核苷酸的单链 DNA等 3种方法。
温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录