本书简单明了,实用性强
第1章表观遗传学概论
施扬1 王司清2 谭理2 蓝斐2
1.牛津大学路德维格癌症研究所;2.复旦大学
人们曾经以为只要解读了DNA序列就能掌握生命的全部奥秘,然而事实并非如此。例如,在农作物玉米中,b1基因的表达可以使玉米出现紫色的花青素沉积,而DNA甲基化和非编码RNA介导的b1基因表达沉默使玉米呈现浅色[1]。紫色玉米与浅色玉米杂交后,原来表达的b1基因也不再表达,看起来像浅色玉米的等位基因将紫色玉米的基因“突变”了一样,这种现象被称为“副突变(paramutation)”[2]。又如,在Avy小鼠中,Agouti基因DNA甲基化程度不同可以导致基因组相同的小鼠毛发颜色不同[3]。这类生物学表型存在显著差异但DNA序列却没有改变的现象无法用传统的遗传学理论解释,属于经典的表观遗传学现象。此外,DNA序列的改变也远不能解释所有的疾病现象,表观遗传调控异常被认为是很多疾病发生发展的重要因素。
1942年,Waddington最早提出了“表观遗传学(epigenetics)”的概念,由“遗传学(genetics)”和“后成论(epigenesis)”合并而成,用于描述发育过程中从基因型转化为表型的机制[4,5]。表观遗传学词源中的“后成论”最早出现在17世纪,是指生物体由最初的未分化状态(如受精卵、孢子)经过多步分化发育过程最终生长为成熟体[即成熟体并不是由初始状态直接放大形成,与“先成论(preformationism)”相反]。表观遗传学的“表观(epi-)”是“在 之上、之外”的意思,即研究在遗传学之上拓展的内容。Waddington随后又以一幅著名的“表观遗传地势图(epigenetic landscape)”(图1-1)形象地表述了他对表观遗传调控发挥功能的假想——将受精卵分化为不同细胞的过程比作小球从山顶经过不同路径滚到山脚不同位置的过程,将山坡上的丘陵和山谷构成的“表观遗传地势”类比为调控细胞分化的路径[6]。1990年,Holliday提出了“表观遗传继承(epigenetic inheritance)”的概念,即发育过程中基因活性的调控模式被子代细胞继承的过程,该过程遗传了DNA序列之外的其他可传递信息,如DNA甲基化[7]。1996年,Riggs等发现减数分裂过程也可伴随“表观遗传继承”[8]。2007年,Allis、Jenuwein和Reinberg主编的Epigenetics从分子角度将表观遗传学定义为“在同一个基因组上,建立并调控基因激活(转录)或沉默信号的染色质模式的总和”[9]。其机制包括:DNA甲基化、部分组蛋白的修饰、基因组印记(genomic imprinting)、RNA干扰(RNA interference)、基因沉默,以及副突变(paramutation)。
最早研究的表观遗传调控机制是DNA甲基化修饰。DNA甲基化在20世纪40年代(同时代Waddington提出“表观遗传学”概念)被发现存在于哺乳类动物组织细胞中[10]。20世纪70年代,研究人员发现癌症发生过程中DNA甲基化发生变化[11],并提出DNA修饰可作为基因活性遗传的载体,调控细胞分化和胚胎发育[12,13]。Holliday则明确提出DNA甲基化是一种表观遗传调控机制,在发育、癌症发展等过程中,
可以在不改变DNA序列的情况下调控基因表达[14]。1987年,Holliday进一步提出生殖细胞DNA甲基化缺失引起的表观遗传缺陷能遗传给后代[15]。20世纪80年代末,Bestor等发现DNA甲基转移酶DNMT1,为解析DNA甲基化建立与维持的分子机制奠定了基础[16,17]。然而,负责DNA去甲基化关键起始步骤的甲基氧化酶TET1一直到20余年后才被Rao等发现[18]。在过去的半个多世纪里,人们对DNA甲基化在染色质结构与基因表达调控、胚胎发育、细胞分化及多种疾病中的作用进行了广泛且深入的研究,以DNA甲基化酶抑制剂5-Aza等为代表的小分子化合物也成为了最早被FDA批准应用于某些特定肿瘤临床治疗的表观遗传靶点药物[19]。
20世纪80~90年代,组蛋白修饰被发现可以调控染色质结构与基因转录。1988年,Grunstein发现切除组蛋白H4的N端尾巴会抑制基因转录,并改变染色质结构、细胞周期长度及酵母的交配型[20]。1990年,Szostak和Smith发现组蛋白H4的N端特定赖氨酸突变也可以引起这些表型,并推测是赖氨酸乙酰化所致[21,22]。1996年,Allis[23]和Schreiber[24]分别发现了组蛋白乙酰化酶GCN5和组蛋白去乙酰化酶HDAC1,首次证明了组蛋白乙酰化修饰可以调控基因表达。在随后数年里,Stallcup[25]、Jenuwein[26]与Shi[27]陆续发现了组蛋白精氨酸甲基化酶CRAM1、组蛋白赖氨酸甲基化酶SUV39H1与组蛋白去甲基化酶LSD1,揭开了组蛋白甲基化修饰动态调控与功能研究的序幕,其中LSD1的发现纠正了长达40余年“甲基化修饰不可逆”的错误认识。2000年,BrianStrahl和DavidAllis提出了“组蛋白密码”假说[28],认为多种组蛋白修饰以组合或特定顺序方式作用于一个或多个组蛋白尾部而发挥独*的下游功能,这将组蛋白修饰的重要性提到一个新高度。
虽然大部分表观遗传调控机制研究关注染色质上DNA与组蛋白的共价修饰(图1-2),但也有很多表观遗传调控方式并不发生在染色质上(例如,发生在RNA上的m6A修饰、朊病毒引起的可遗传的表型变化)。由于篇幅所限,表观遗传学的发展过程中还有很多重要事件本文未能逐一提及,读者可以在本书后面的章节中阅读。本书不仅介绍了DNA甲基化、组蛋白修饰与染色质重塑等经典内容,还涉及非编码RNA、RNA修饰和染色质拓扑结构域(TAD)等热点内容。
尽管表观遗传学在过去几十年里取得了巨大的进展,但仍然有许多问题有待于深入研究和探索。首先,表观遗传调控的分子机制(包括新的表观遗传修饰、新的识别机制、染色质三维结构动态变化,以及非染色质的表观遗传机制等)依然是本领域研究的重要内容。其次,多种表观遗传调控机制如何相互协调?表观遗传调控机制在正常发育与各种疾病中的作用?环境刺激、饮食代谢与心理等因素如何引起表观基因组的改变(甚至影响后代的表型)?这些问题都是值得不断探索的方向。毋庸置疑,表观遗传学研究将帮助人们理解疾病发生发展的机制,并在转化应用方面为疾病的诊断与治疗提供新靶点。
第2章DNA甲基化
陈太平1 李恩2
1.美国得克萨斯大学MD安德森癌症中心;2.诺华(中国)生物医学研究所
本章概要
DNA甲基化(即胞嘧啶第五位碳原子甲基化,5mC)是一种重要的表观遗传修饰,参与调节染色质结构和基因表达。DNA甲基化的主要位点是胞嘧啶-鸟嘌呤(CpG)二核苷酸,在哺乳动物细胞中,大部分(70%~80%)CpG位点会被甲基化,5mC主要分布于异染色质区域和基因体,而基因启动子区域的CpG岛通常处于非甲基化状态。DNA甲基化由DNA甲基转移酶(DNMT)催化:DNMT3A和DNMT3B主要负责从头甲基化从而建立DNA甲基化模式,DNMT1则在DNA复制过程中维持DNA甲基化模式。基因启动子甲基化抑制转录主要通过两种机制,即直接干扰转录因子结合或者通过5mC结合蛋白招募转录阻遏物间接发挥作用。对基因敲除小鼠的研究结果表明,DNA甲基化对哺乳动物胚胎发育至关重要,在细胞分化、基因组印记、X染色体失活、维持基因组稳定性等方面起关键作用。异常的DNA甲基化水平和模式、参与DNA甲基化的酶和调节因子突变与多种人类疾病有关,包括癌症和发育性疾病。研究DNA甲基化的功能和分子机制既有助于阐明许多基本的生物学过程,也与人类健康有直接关联,在疾病诊断及治疗等方面具有临床应用前景。
2.1DNA甲基化概述
广义的DNA甲基化泛指发生在DNA上的所有甲基化修饰,包括将腺嘌呤(A)转变为N6-甲基腺嘌呤(6mA)、将胞嘧啶(C)转变为N4-甲基胞嘧啶(4mC)或C5-甲基胞嘧啶(5mC)。在原核生物中,这三种类型的甲基化均存在,以6mA和4mC为主。而在真核生物中,DNA甲基化的主要类型为5mC,有些物种的基因组含有微量的6mA。因此,在表观遗传学领域,DNA甲基化通常特指5mC(图2-1)。以下的叙述仅限于5mC。
5mC于1925年首先在结核杆菌中被发现,直到1948年才发现5mC也存在于小牛胸腺DNA中,随后的研究证实DNA甲基化广泛存在于真核生物中,包括许多动物、植物和真菌。但由于在进化过程中DNA甲基转移酶(DNA methyltransferase,DNMT)同源基因的变异或丧失,有的低等生物只有极低水平的5mC(如在果蝇中),或者完全缺乏这种修饰(如在酵母、线虫中)。DNA甲基化的主要位点是胞嘧啶-鸟嘌呤(CpG)二核苷酸,非CG甲基化可发生在CHG(H=A、C或T)和CHH位点上。CG甲基化和CHG甲基化又被称为对称性甲基化(symmetric methylation),因为DNA双链上两个对应的胞嘧啶同时被修饰;CHH甲基化只能发生在一条DNA链上(另一条链上缺乏对应的胞嘧啶),因而被称为非对称性甲基化(asymmetric methylation)(图2-1)。在动物细胞中DNA甲基化形式主要为CG甲基化;植物细胞以CG甲基化为主,但CHG甲基化和CHH甲基化也比较普遍,其中CHG甲基化在植物中尤其常见,原因是维持CHG甲基化的酶即染色质甲基化酶(chromomethylase,CMT)为植物所特有。在真菌细胞中,CG甲基化和CHH甲基化所占比例大致相当。根据DNA甲基化在不同物种中的水平、分布模式及意义,一般认为,DNA甲基化的原始功能是基因组防御(genome defense),即维持转座元件(transposable element)的沉默以免转座(transposition)影响宿主基因组的稳定性。随着物种的进化,DNA甲基化逐渐参与其他生物学过程,使其功能越来越复杂化。本章着重讨论DNA甲基化在哺乳动物中的作用。
图2-1DNA甲基化的类型
哺乳动物细胞中的大部分(70%~80%)CpG二核苷酸被甲基化,少数特殊类型的细胞[如胚胎干细胞(embryonic stem cell,ESC)、神经元细胞及卵母细胞]也含有相对较高水平的非CG甲基化[1]。5mC并非随机地分布于基因组序列中,总体而言,重复序列通常被高度甲基化,包括异染色质(heterochromatin)区域内的重复序列如卫星DNA(satellite DNA),以及散在分布于基因组的其他重复序列如长散在元件(long interspersed nuclear element,LINE)、短散在元件(shortinterspersed nuclearelement,SINE)和含有长末端重复序列的内源性逆转录病毒(longterminal repeat-containingendogenous retroviruse,ERV)。基因内甲基化(intragenic methylation)也很常见,尤其在外显子中的CpG位点甲基化程度通常较高,而CpG岛(CpG island,CGI)中的CpG位点一般处于非甲基化状态。CpG岛通常是指长度为300~3000bp并且GC含量很高的区域,多位于基因的启动子和5′端非翻译区。DNA甲基化对哺乳动物的正常发育是必需的,在诸如基因组印记(genomic imprinting)、X染色体失活(X chromosome inactivation)及维持基因组稳定性方面起关键作用。在细胞水平上,DNA甲基化对染色质结构和基因转录具有重要调节功能,异常的DNA甲基化水平和分布模式与癌症等多种人类疾病密切相关。
温馨提示:请使用中新友好图书馆的读者帐号和密码进行登录