54 当归
【药材基本信息】 当归 [Angelica sinensis(Oliv.)Diels]为伞形科当归属药用植物 [1],其干燥成熟的根为当归中药材(图2-54-1)。收载于《中华人民共和国药典》(《中国药典》)(2020年版) [2]。分布于甘肃东南部,以岷县产量居多、质量*优,此外在云南、四川、陕西、湖北等省均有栽培。味甘、辛,性温。归肝、心、脾经 [3]。具有补血活血、调经止痛、润肠通便的功效 [4]。现代研究表明,当归具有抗血小板聚集、抗炎、增强机体免疫力、对脑缺血损伤的保护、抗肿瘤、调经、平喘等作用。能够促进心血管功能,改善血液循环 [5, 6]。
图2-54-1 当归
【叶绿体基因组】 当归的叶绿体 DNA为典型环状分子,其叶绿体基因组(GenBank登录号: NC042826.1)[7]的总长度为 142 485bp,具有保守的四分状结构,包括一个大单拷贝区(large single-copy region,LSC区)、一个小单拷贝区(small single-copy region, SSC区)和一对反向重复区(inverted repeat region,IR区),各个区的长度分别为 99 782bp、 17 577bp和 12 563bp(图2-54-2)。当归叶绿体基因组的整体 G/C含量为 38.00%。其 IR区的 G/C含量(47.39%)高于 SSC区的 G/C含量(31.04%)和 LSC区的 G/C含量(36.13%)。
图2-54-2 当归叶绿体基因组图谱
该图包括6个圆形轨道。自内向外的**轨道表示分散重复序列,红色弧线表示直接重复序列,绿色弧线表示回文重复序列;自内向外的第二轨道上的蓝色柱状线条表示长串联重复序列,其重复单元碱基长度> 7;自内向外的第三轨道以不同颜色的柱状线条表示不同类型的短串联重复序列(微卫星序列),其中黑色表示复杂重复序列,绿色表示重复单元碱基长度为 1的重复序列,黄色表示重复单元碱基长度为 2的重复序列,紫色表示重复单元碱基长度为 3的重复序列,蓝色表示重复单元碱基长度为 4的重复序列,橙色表示重复单元碱基长度为 5的重复序列,红色表示重复单元碱基长度为 6的重复序列;自内向外的第四轨道上以不同色块表示 SSC区、反向重复区 IRa和 IRb、LSC区,数字代表相应区间的长度;自内向外的第五轨道表示 GC含量;*外层第六轨道以不同色块表示不同功能的编码基因,功能分类详见图中左下角注释,基因名称后括号中的数字表示密码子使用偏差,轨道外侧的基因转录方向为顺时针方向,轨道内侧的基因转录方向为逆时针方向
【编码基因】 当归的叶绿体基因组共编码 125个基因,其中*特基因 112个,包括蛋白质编码基因 82个(*特基因 79个)、转运 RNA(transfer RNA,tRNA)编码基因 35个(*特基因 29个)、核糖体 RNA(ribosomal RNA,rRNA)编码基因 8个(*特基因 4个)(表2-54-1)。其中 2个蛋白质*特编码基因(ycf1、psbA)、6个 tRNA*特编码基因(trnH-GUG、trnR-ACG、trnN-GUU、trnI-GAU、trnA-UGC、trnM-CAT)、4个 rRNA*特编码基因(rrn16S、rrn23S、rrn4.5S、rrn5S)位于 IR区。有 9个蛋白质编码基因(petB、petD、rpl2、rps16、atpF、rpl16、rpoC1、ndhB、ndhA)各含有 1个内含子(intron), 3个蛋白质编码基因(clpP、ycf3、 rps12)各含有 2个内含子,有 8个 tRNA编码基因 [trnK-UUU、trnG-UCC、trnL-UAA、trnV-UAC、trnI-GAU(×2)和 trnA-UGC(×2)]各含有 1个内含子(表2-54-2)。当归叶绿体基因组中蛋白质编码区(coding sequence, CDS)的长度为 69 110bp,占整个基因组长度的 48.50%。rRNA基因的长度为 9058bp,占整个基因组长度的 6.36%。而 tRNA基因的长度为 2639bp,占整个基因组长度的 1.85%。当归叶绿体基因组非编码区主要包括内含子和基因间区,其长度占整个基因组长度的 43.29%。
表2-54-1 当归叶绿体基因组基因列表
表2-54-2 当归叶绿体基因内含子和外显子位置及长度
续表
注:“+”表示正链;“–”表示负链;“ND”表示未确定
【重复序列】 在当归叶绿体基因组中,微卫星序列(microsatellite sequence)有 A/T、 C/G、AT/AT三种类型,各有 45个、3个、8个(表2-54-3)。串联重复序列(tandem repeat sequence)是指在染色体上一段重复单元连续多次排列组成的序列。共发现23个串联重复序列,满足总长度超过 20bp 且重复单元之间的相似度 ≥ 90% 两个条件(表2-54-4)。散在重复序列(interspersed repeat sequence)是与串联重复序列的组织形式不同的另一类重复序列,重复单元以散在方式分布于基因组内。散在重复序列包括回文重复序列和正向重复序列。以 e值(e-value)小于 1E–04为阈值,当归叶绿体基因组散在重复序列包括 6条回文重复序列、13条正向重复序列(表2-54-5)。
表2-54-3 当归叶绿体基因组微卫星序列统计
表2-54-4 当归叶绿体基因组串联重复序列统计
续表
表2-54-5 当归叶绿体基因组散在重复序列特征值
续表
注:P. palindromic repeat,回文重复序列;D. direct repeat,正向重复序列
【高可变区】 为了发现当归属物种间的高可变区,从 10个当归属物种叶绿体基因组中提取了 69种基因间区,采用 K2p(Kimura 2-parameter)模型计算基因间区的遗传距离。遗传距离*大的 30个基因间区见图2-54-3。其 K2p平均值分布于 0.97~ 6.21,其中 ycf4-cemA、ycf2-trnL-CAA、petA-psbJ和 psbF-psbE的 K2p平均值较高,分别为 6.21、3.44、2.67和 2.51。由此可见,当归属 10个物种的叶绿体基因组在这 4个区域的变异较大,这 4个区域可作为潜在的分子标记开发区域。
图2-54-3 当归属 10个物种基因间区的遗传距离分析结果
展开