玉米基因组学及农艺性状基因克隆研究进展

时间:2022-05-29 15:44:01 来源:网友投稿

摘要:介绍了玉米(Zea mays L.)基因组学的研究发展历程,概述了玉米基因组学的研究进展。重点论述了玉米基因组的结构特征,玉米功能基因组学的发展现状,玉米重要农艺性状的基因克隆,包括株高和株型相关基因的克隆,产量相关性状基因的克隆以及品质性状相关基因的克隆,并展望了玉米基因组学的发展前景。

关键词:玉米(Zea mays L.);基因组学;农艺性状;基因克隆

中图分类号:S513;Q785 文献标识码:A 文章编号:0439-8114(2016)05-1094-05

DOI:10.14088/j.cnki.issn0439-8114.2016.05.002

Research Progress on Maize Genomics and Gene Cloning of Agronomic Traits

GAO Zhi-yong1,2,YUAN Ting-pan1,ZHAO Ya-lan1,YIN San-xia1

(1. School of Chemistry and Life Science,Weinan Normal University,Weinan 714099,Shaanxi, China;

2. Key Laboratory of River Wetland Ecology and Environment in Shaanxi Province,Weinan 714099,Shaanxi, China)

Abstract: The paper introduces the development process of maize genomics, and summarizes the research progress of maize genomics. It focuses on the structural characteristics of the maize genome, functional genomics, and gene cloning of important agronomic traits, including plant height and plant type, yield, and quality traits. The future work was prospected on the development of maize genomics in the end.

Key words: maize(Zea mays L.); genomics; agronomic traits; gene cloning

大约在1万年前,在美洲中部墨西哥驯化了当地的类蜀黍,形成了玉米(Zea mays L.),从此,玉米一直在种植和培育。在历史的长河中,玉米基因组经过了多轮的复制。大约在7 000万年前,发生了古多倍体祖先的全基因组复制;5 000万~12 000万年前,进行了额外全基因组复制等。通过这些事件,玉米和它的近亲高粱(Sorghum bicolor)分离开来。玉米的基因组有10条染色体,在进化中经历了动态变化,使得玉米基因组在结构上显示出复杂性。在过去的大约300万年中,发生了长末端重复反转录转座子(LTR retrotransposons)的增殖,使得玉米基因组发生了大规模的急剧扩增,基因组的大小达到了2.3×109。目前,作为一种重要的单子叶模式植物,尤其是由于其功能基因组学的发展和进步,玉米用在了许多重要的基础研究上,主要的研究领域有基因和染色体的物理连锁、基因的遗传和功能、发育和细胞生物学、生物信息学的交叉、端粒的特征、基因的转座、核仁的起源、数量遗传和育种以及表观遗传学研究等。

1 玉米基因组的结构特征

2005年美国国家科学基金会、能源部、农业部资助玉米全基因组的测序工作。来自于美国的亚利桑那大学和圣路易斯华盛顿大学等科研机构的150名科研人员承接了这项工作。研究小组选取了B73自交系为测序材料,工作人员经过了4年多的艰苦努力,终于完成了测序工作,研究成果发表在了2009年11月份的《科学》期刊上[1]。测序工作中,科研人员利用细菌人工染色体(Bacterial artificial chromosome,BAC)(n=16 848)和来源于完整的遗传和物理图谱的Fosmid克隆(n=63),进行了全基因组的测序,并且运用了光学图谱进行了强度比。其中通过大约4~6倍的鸟枪法(Shotgun)对单克隆进行了测序,对一些独特的区域又做了人工与自动完善,获得了首版的B73参考基因组(B73 RefGen_v1)。B73 RefGen_v1揭示了玉米基因组的大小达到了2.3×109,并预测了32 000多个基因,其中99.8%的基因定位在了染色体上。Messing等[2]早年通过对玉米的全基因组中的大量插入克隆片段末端的测序,测序了基因组中的6.2 kb的片段,共累积了大约1/8的全基因组序列,其中对大量的基因和转座子进行了描述。总的累积的序列有307 Mb,其中重复序列占了58%,基因区域占了7.5%,预测了大约59 000个基因。

在玉米的基因组中,由于存在高密度重复序列和复杂的结构,并且还有活性高的Mutator 转座子,所以要对基因组进行精确的预测,会存在很大的困难。这个基因组中有几百个转座子基因家族,总共占了接近85%,在基因组中非均匀地散布,它们的转座,造成了大量的基因复制和捕获,该基因组中有接近85%是由非均匀分散于整个基因组中的几百个转座子家族组成。这些转座元件影响了数以千计的基因片段的捕获和复制,改变了着丝点的组成、大小及位置。

在玉米的基因组中,转座因子(Transposable element,TE)含量非常丰富,B73 RefGen_v1中显示转座子占了85%,其中有丰富的Ⅰ类RNA转座子和活跃的Ⅱ类DNA 转座子[3]。在玉米中,最先发现了转座子,并且 Spm/En系统、PIF/Harbinger、Hat(Ac转座子)、Mutator 超基因家族、MITE家族最初也都是在玉米中发现的。

在玉米中还存在着长末端重复反转录转座子,并且也非常丰富。大约82%的转座子已经得到了鉴定。在各类转座子家族中,最为复杂的是Mutator 超家族,其元件的大小和序列有着极大的差异,其中包含有262个MULEs(Mutator-like elements that contain gene fragments),MULEs 含有226个核基因的片段。通过对40 000个Mutator 活性区域的非冗余转座子插入位点进行扩增和测序,对应地绘制到了B73 RefGen_v1中,试验结果显示,在减数分裂中,Mutator 插入位点重组率最高,许多转座子都插入在含丰富基因及重组活性高的染色体的末端。

在植物、动物和真菌中,存在着一类称作Helitrons 的转座子。Helitrons 在玉米中含量丰富,转座活性高,转座方式采用滚环模式。在玉米中,有8个Helitrons 家族,大约总共有20 000个拷贝,在获取基因片段时,其表现异常活跃。在早先的动植物基因组研究中,显示Helitrons大部分存在于基因富集区[4]。在B73 RefGen_v1中,长末端重复反转录转座子的含量超过了全基因组的75%,它们在基因组中分散存在,它们的406个基因家族中,大部分的拷贝数小于10个。LTR retrotransposons 具有家族特异性,在染色体上分布也不均匀,像类Copia 因子(Copia-like elements)常常在基因丰富的常染色质区域大量存在,而类Gypsy 因子(Gypsy-like elements)却大量存在于基因稀疏的异染色质区域,研究显示长末端重复反转录转座子含有的核基因片段大于180个。

随着功能基因组学发展,产生了海量数据,也为研究提供了很好的生物信息学的平台。玉米遗传和基因组信息资源MaizeGDB(http:///)是英国农作物生物信息学网络数据库,拥有很多其自己开发的数据库和分析软件,同时也收集了相关的一些文献和美国该领域的一些信息。水稻(http://ars-genome.cornell.edu/rice/)、小麦(http://www.tigr.org/tdb/e2k1/tae1/)和Panzea(http://panzea.org/database)等专一作物的数据库,由美国TIGR institute维护的小麦基因组数据,提供小麦的基因组及基因注释,同时,还提供其它谷类作物的同源基因数据,如玉米、大麦、高粱、水稻等主要农作物,为玉米功能基因组学研究提供大量不同数据和信息。

2 玉米功能基因组学研究进展

在玉米的研究史上,2009年的玉米自交系B73的测序完成可以说是一个大的飞跃,为玉米基因组学的研究提供了巨大的数据支撑。而后随着分子生物学的迅猛发展,测序技术的进一步完善,B73 RefGen_v2随之问世,使对玉米基因组的认识更加全面和精细,给玉米的分子生物学研究带来了更大的便利。最近,在由冷泉港实验室和深圳华大基因研究院等单位主导完成的玉米遗传变异研究论文发表在Nature Genetics[5]上。Chia等[5]对105个野生和栽培玉米品种进行了测序和分析,成功构建了第二代玉米单体型图谱(简称Maize HapMap 2),并对玉米的遗传多样性进行了全面分析。在研究中,他们建立了精密的群体遗传学评分模型(Population-genetics scoring model),共鉴定了5 500多万个遗传分子标记,同时发现染色体结构变异(SV)在玉米野生种和栽培种的基因组中是普遍存在的,并且推测这些结构变异与很多重要的农艺性状具有密切的关联。

此外,在研究影响玉米基因组大小的主要因素时,研究人员发现染色体结(一种密集的DNA结构,Chromosomal knobs)的存在或缺失造成了“种内”玉米基因组大小出现很大的差异;而在“种间”进行比较时,他们发现玉米基因组大小的变化则主要与大量的转座子有关。

考古学及遗传学证实玉米大约驯化自1万多年前,在驯化过程中,玉米经历了一次特殊的表型转变,这使其更加容易满足人类的需求。通过对75个玉米株系(包括野生玉米、美洲各地的传统品种和现代改良玉米品系)进行全基因组重测序,并对玉米驯化进行了全面的评估分析。研究发现玉米在经过人工驯化之后又产生了新的遗传多样性,并推测这很有可能是由于野生近缘物种的基因渗入所导致的。研究人员发现了数百个具有强烈选择信号的基因,并推测这些基因可能在玉米的驯化过程中发挥着重要的作用[6]。此外,研究数据还表明在玉米的驯化过程中,千百年前古代农民应用的人工驯化方法似乎比现代育种学家所使用的方法发挥了更大的作用。

通过驯化,人类已经大大地改变了大刍草形态,成为今天可以辨认的玉米。这个系统作为研究复杂性状适应、基因组进化以及其遗传学和进化的模式。为了研究驯化如何重新形成玉米幼苗的转录组,分析38个不同的基因型玉米和24类蜀黍的基因型的18 242个基因表达谱,玉米与大刍草相比,超过600个基因具有显著不同的表达水平。此外,超过1 100个基因表现出显著共表达改变。这项研究不仅证明了随着驯化玉米转录组发生改变,鉴定了几个负责玉米进化的基因,而且明确了基因表达结合群体遗传学分析可以获得基因互补的信息[7]。

3 玉米重要农艺性状基因的克隆

目前,许多模式植物已经测序,研究也更加深入,基因功能的研究方法也更加完善,玉米的功能基因组学研究也成为了分子生物学研究的热点领域之一。定位克隆(Positional cloning)在早期的克隆基因研究中应用较多。相对于其他一些模式植物,玉米的基因组较大,重复序列多,重要基因的定位克隆令人望而却步。随着玉米全基因组序列的发表,DNA测序技术进步,以及玉米全基因组关联分析和比较基因组学技术发展等,应用定位克隆技术也成功地克隆了玉米的重要关键基因和QTL。整合图位克隆,比较基因组和关联分析等多种方法来加速玉米株高主效QTL的克隆,即先使用高密度的遗传图谱迅速将玉米主效株高QTLs转变为单个孟德尔因子,将其表型效应放大,然后再逐一地精细定位;接着利用比较基因组将不同作物之间各种不同的功能基因组平台串联起来进行基因候选;再使用定点的关联分析、基因的跨物种转化或者不同作物的株高突变体来验证基因的功能。

3.1 株高和株型相关基因的克隆

茎秆是玉米株型的重要组成部分,是影响产量的重要因素。在玉米栽培和驯化过程中,其株型发生了两次革命性的变化:即由多分蘖大刍草到独秆和由高秆玉米农家种到半矮秆的玉米自交系的转化。两者变革使玉米的株型紧凑、密植不倒伏成为可能,为玉米的高产奠定了基础。

目前,已知控制株高的基因在单子叶和双子叶植物高度保守。玉米dwarf8(d8)突变体茎秆极端矮小,叶片缩短,花期变长。它编码一个DELLA蛋白,是一个显性对赤霉素不敏感的矮秆基因。dwarf3(d3)编码一个细胞色素P450(CYP88A)蛋白,作用于赤霉素合成途径[8]。玉米br2突变体茎秆节间缩短,二叶片、雄蕊的大小正常,br2基因控制生长素在茎秆中的极性运输。玉米na1编码一个与拟南芥DET2同源的蛋白,调节油菜素内酯生物合成,进而影响植株的高低。

在当前的研究中,玉米株高等重要农艺性状QTL的克隆进展缓慢,主要原因表现在:大多数玉米株高等重要农艺性状受多个遗传效应低的QTL控制;表型自然变异的功能性位点多位于调控区,过于隐蔽,不易定位。在B73 X Mo17的群体中共定位了6个控制株高的QTL,解释了73%的表型变异,加性效应在6.1 cM到9.1 cM之间。玉米开花相关基因vgt1(Vegetative to generative transition 1)功能性位点在该基因上游70 kb启动子区[9]。控制玉米分蘖数的tb1开放读码框上游60~70 kb位置上插入了Hopscotch转座子,使得玉米tb1基因表达上调,从而玉米多分蘖变成独秆。

株型紧凑的玉米品种茎叶夹角小,上部叶片趋于直立。透光性好,宜于密植。最近,有人利用GWAS全基因组关联分析,从玉米基因组中发现了160万个遗传位点。在此基础上鉴定了与茎叶夹角性状相关的基因。玉米品种之间茎叶夹角差异最大可达80。但是,发现单基因的最大效应仅能达到1.5。因此茎叶夹角的性状是通过多个基因产生微小效应叠加的结果[10]。

3.2 产量相关性状的基因克隆

玉米产量性状也是复杂的数量性状,受多基因和环境变化的影响。例如,用3×87-1的441个永久F2群体,定位了27个包括穗行数、百粒重等产量性状的QTL。对71个欧洲玉米自交系扫描了9个多态性位点,证明其中6个与玉米开花期相关[11]。最近,在玉米第四染色体上克隆fea2基因,控制穗行数,并且存在一个产生基因表达量差异的功能性变异,但其位置仍然未知[12]。

落粒性也是一个重要的产量性状。利用玉米祖先大刍草和玉米高代回交,含886个体的大群体迅速将两个玉米主效落粒QTL精细定位[13]。该基因克隆策略是利用图位克隆、关联分析和比较基因组学手段结合驯化综合征在禾本科植物类似分子遗传学基础的原理,首先同时克隆了高粱一个质量基因Sh1、两个玉米落粒基因、一个水稻落粒QTL。高粱Sh1落粒基因序列存在三个功能变异,分别是调控Sh1表达的单倍型,Sh1失去第二和第三外显子的大片段缺失,一个是调控Sh1第四外显子被异常剪切的剪切位点变异。通过比较基因组学定位获得四个同源区段,两个玉米落粒QTL、一个水稻落粒QTL和一个谷子落粒QTL分别位于这4个区段内。因而,实现了QTL跨物种的基因克隆。

同时,玉米抗倒伏性状是玉米产量相关性状的关键因素,与茎秆组织细胞壁结构,纤维素组成和机械强度密切相关,作物倒伏或折断是玉米高产稳产和机械化收获的重要生物学基础。作物抗倒伏性是由作物倒伏基因或者称作脆秆基因所控制的。水稻中的脆秆基因有较为详细的报导,但是在玉米中的研究甚少。已知玉米中有6个脆秆基因,分别是BK1、BK2、BK3、btn1、bk-x、bk2,而这些报道只是简单遗传和表型分析。利用基因同源性,推测bk2可能编码类似糖基锚定蛋白,调控次生细胞壁纤维素合成,进而影响茎秆的机械强度[14]。因此,玉米的脆秆基因研究有待于功能基因组等相关技术的综合运用。

3.3 品质性状相关基因的克隆

玉米子粒的形成过程涉及一系列基因时空表达的改变和调节。利用4~6 d和7~23 d的胚乳构建cDNA文库。分析其中Cotigs和Singletons,排除贮藏蛋白基因外,至少有5 000个基因发生了变化[15]。DNA芯片分析表明,在玉米幼穗4个发育阶段,有2 794个基因表达发生变化[16]。针对玉米子粒动态形成过程,分别对授粉后不同灌浆阶段粒重、子粒灌浆速率、淀粉积累相关酶活性和可溶性碳水化合物浓度进行QTL定位分析,表明粒重QTL定位分析结果受基础材料、定位群体类型和大小、子粒灌浆时期、遗传图谱标记饱和度、定位方法和环境条件等多种因素的单独和综合影响。通过构建NILs精细定位和图位克隆主要目标QTL,具有更为重要的理论意义。

子粒的氨基酸组成是衡量蛋白质品质的重要指标,尤其是赖氨酸和色氨酸的含量。Opaque-2基因突变体是高赖氨酸突变体,赖氨酸含量达4%左右[17],这是由于Opaque-2子粒中zein蛋白含量大幅度下降,而非zein蛋白含量上升。但是,其子粒是软质胚乳,产量相对较低,因而限制了其应用。后来由于Opaque-2修饰因子发现和应用,可使玉米子粒赖氨酸含量增加1倍。玉米Opaque-2基因控制的子粒,在普通玉米中赖氨酸含量为0.20%,色氨酸为0.06%,而高赖氨酸玉米中分别达到0.48%和0.13%,是普通玉米的两倍多。并且高赖氨酸玉米子粒中的组氨酸、精氨酸、甘氨酸、蛋氨酸、天门冬氨酸等的含量略高于普通玉米。但是,在实际应用过程中如何将高赖氨酸的基因和软质胚乳修饰的多个数量性状基因导入骨干育种自交系当中仍然是巨大的挑战。

4 展望

随着玉米研究的更加深入,EMS诱变和Mutator 诱变突变体库的建立,使得更多的玉米质量性状的突变体被发现,定位克隆技术随之发展更为迅速。目前,新的定位克隆技术在克隆基因上更为有效,更加完善了玉米基因组序列,玉米的功能基因组学研究将进入一个崭新的发展时期。

参考文献:

[1] SCHNABLE P S, WARE D, FULTON R S, et al. The B73 maize genome: Complexity, diversity, and dynamics[J]. Science, 2009, 326(5956): 1112-1125.

[2] MESSING J, BHARTI A K, KARLOWSKI W M, et al. Sequence composition and genome organization of maize[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(40): 14349-14354.

[3] SANMIGUEL P, TIKHONOV A, JIN Y K, et al. Nested retrotransposons in the intergenic regions of the maize genome [J]. Science, 1996, 274(5288): 765-768.

[4] LAI J, LI Y, MESSING J, et al. Gene movement by Helitron transposons contributes to the haplotype variability of maize [J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(25): 9068-9073.

[5] CHIA J M, SONG C, BRADBURY P J, et al. Maize HapMap2 identifies extant variation from a genome in flux[J]. Nature Genetics, 2012, 44(7): 803-807.

[6] HUFFORD M B, XU X, VAN HEERWAARDEN J, et al. Comparative population genomics of maize domestication and improvement [J]. Nature Genetics,2012,44(7):808-811.

[7] SWANSON-WAGNER R, BRISKINE R, SCHAEFER R,et al. Reshaping of the maize transcriptome by domestication[J]. Proceedings of the National Academy of Sciences,2012,109(29): 11878-11883.

[8] HELLIWELL C A, SULLIVAN J A, MOULD R M, et al. A plastid envelope location of Arabidopsis ent-kaurene oxidase links the plastid and endoplasmic reticulum steps of the gibberellin biosynthesis pathway[J]. The Plant Journal,2001,28(2): 201-218.

[9] SALVI S, TUBEROSA R, CHIAPPARINO E, et al. Toward positional cloning of Vgt1, a QTL controlling the transition from the vegetative to the reproductive phase in maize[J]. Plant Molecular Biology, 2002, 48(5): 601-613.

[10]TIAN F, BRADBURY P J, BROWN P J, et al. Genome-wide association study of leaf architecture in the maize nested association mapping population[J]. Nature Genetics,2011, 43(2): 159-162.

[11]ANDERSEN J R, SCHRAG T, MELCHINGER A E, et al. Validation of Dwarf8 polymorphisms associated with flowering time in elite European inbred lines of maize (Zea mays L.) [J]. Theoretical and Applied Genetics, 2005, 111(2): 206-217.

[12]BOMMERT P, NAGASAWA N S, JACKSON D. Quantitative variation in maize kernel row number is controlled by the FASCIATED EAR2 locus[J]. Nature Genetics, 2013, 45(3): 334-337.

[13]LIN Z, LI X, SHANNON L M, et al. Parallel domestication of the Shattering1 genes in cereals[J]. Nature Genetics, 2012, 44(6):720-724.

[14]CHING A, DHUGGA K S, APPENZELLER L, et al. Brittle stalk 2 encodes a putative glycosyl phosphatidylinositol-anchored protein that affects mechanical strength of maize tissues by altering the composition and structure of secondary cell walls[J]. Planta,2006,224(5):1174-1184.

[15]LAI J, DEY N, KIM CS, et al. Characterization of the maize endosperm transcriptome and its comparison to the rice genome[J]. Genome Research,2004,14(10a):1932-1937.

[16]ZHU Y, FU J, ZHANG J, et al. Genome-wide analysis of gene expression profiles during ear development of maize[J]. Plant Molecular biology,2009,70(1-2):63-77.

[17]MERTZ E T, BATES L S, NELSON O E. Mutant gene that changes protein composition and increases lysine content of maize endosperm[J]. Science,1964,145(3629):279-280.

推荐访问:农艺 性状 研究进展 克隆 基因

版权所有:天海范文网 2010-2024 未经授权禁止复制或建立镜像[天海范文网]所有资源完全免费共享

Powered by 天海范文网 © All Rights Reserved.。鲁ICP备10209932号