禾本科(Poaceae)是被子植物的第五大科,约有770属12000种,也是与人类生产和生活关系最为密切、最具经济价值的大科。该科植物包括我们赖以生存的主要粮食作物、饲料如水稻、小麦、玉米、高粱和多种牧草,还有其它有重要经济价值的物种如芦苇、芒、甘蔗和竹子。该科植物同时具有重要的生态价值,表现出了广泛的生态适应性,从森林到草原、沼泽到荒漠、高山到北极都可见其身影。早期的植物分类系统将禾本科分为2-6个亚科,包括竹亚科、早熟禾亚科、假淡竹叶亚科、芦竹亚科、虎尾草亚科和黍亚科等,其中竹亚科除了木本竹子外,还包括稻族和一些草本竹子类群。近十年来的分子系统学研究将禾本科划分成12个亚科,其中最早分化出来的3个基部亚科此前一直被置于竹亚科,其余的9个亚科组成了核心禾草支系。常见的禾本科植物及广泛种植的农作物均来自于核心禾草类,现有的禾本科遗传学、基因组学和进化研究都集中于此,而系统演化位置关键的基部禾草则缺乏关注。在早期的分类系统中,基部的3个亚科的物种由于在形态和解剖学特征上与草本竹类相似,均长期被置于竹亚科中。这3个亚科仅有约27个物种,却保留了大量的禾本科祖先性状,是解析该科特有性状起源演化的关键环节。
中国科学院昆明植物研究所李德铢研究员带领的研究团队,多年来致力于竹子的分类学、系统发育和基因组学研究。随着研究的不断深入,研究工作已从竹亚科的木本竹类逐渐扩展到草本竹子以及禾本科基部类群。最近,该研究团队在解析二倍体草本竹子和六倍体木本竹子基因组,并据此揭示竹亚科异源多倍化历史的基础上,依托中国西南野生生物种质资源库,开展了禾本科基部类群原禾属(Pharus)的基因组测序和进化基因组学研究。原禾属是禾本科最早分化出来的两个亚科之一,分布于中南美洲的热带森林地区,也是禾本科中最早演化出来小穗结构的类群。小穗是在禾本科植物演化产生的独特的花部结构,其形态特征与农作物的产量密切相关。
研究团队利用三代PacBio测序技术和Hi-C技术获得了原禾属植物Pharus latifolius染色体级别的参考基因组序列,组装基因组大小为1.0 Gb,经过多种方法评估验证了基因组的可靠性和准确性。与禾本科常见植物如水稻、高粱以及二穗短柄草的参考基因组等相比,P. latifolius基因组较大,与其更古老的重复序列插入有关,并且蛋白质编码基因第三位密码子的GC含量分布与核心禾本科类群不同,却与禾本科近缘类群相似,显示出其基因组特征的古老性。同时,该物种的分子进化速率也远低于禾本科核心类群。利用基因组共线性、重复基因同义替换率和构建系统树等综合分析,揭示了P. latifolius在进化历史中发生了全基因组加倍(Whole-genome duplication, WGD)事件,并且证实该加倍事件与核心类群所共享,即禾本科的ρ-WGD事件,并推断出其发生在白垩纪(约98.2个百万年前)。之后大约8百万年,原禾属所代表的支系与其它核心类群发生分化。然而,ρ-WGD之后的二倍化过程在基部和核心禾草两大支系中表现出巨大差异,核心禾草支系经历了更快的重复基因丢失和更多染色体水平的变异,这可能与核心支系发生了产生更多物种的辐射分化有关。在进化基因组学分析的基础上,研究团队还重点分析了与小穗发育相关的FRIZZY PANICLE (FZP)基因和MADS-box基因家族的转录表达情况与演化历史。发现FZP基因在P. latifolius中有两个拷贝,其中一个拷贝与来自竹亚科毛竹的基因构成姐妹群,而在其它核心类群中均为单个拷贝,同时发现MADS-box家族编码基因数目的增加直接与ρ-WGD事件相关,这为后续的功能验证并最终解析禾本科小穗这一关键农艺性状起源演化的遗传机制提供了基础。
该研究成果以“The Pharus latifolius Genome Bridges the Gap of Early Grass Evolution”为题在国际植物学顶级期刊The Plant Cell发表。昆明植物研究所种质资源库马朋飞博士和刘云龙博士为论文共同第一作者,李德铢研究员为通讯作者。该研究得到了中国科学院战略性先导科技专项(No. XDB31000000)、国家自然科学基金项目(No. 31770239)和中国科学院青年促进会(No. Y201972)项目的支持。
图1. 基于480个单拷贝核基因构建的禾本科系统发育树和时间标定
图2. 禾本科小穗发育相关基因FZP和MADS-box基因家族的演化