转座子是一类可以在基因组上转移和增殖的DNA序列,其长度从几百bp到上万bp不等,普遍存在于地球上所有生物体内,是真核生物基因组的主要组成部分。作为较长的一类转座子序列,LTR逆转录转座子是植物基因组大小的最主要决定因素之一。例如,在157 Mb的拟南芥中LTR逆转录转座子的比例约为5.6%,在389 Mb的水稻基因组中占22%,而在2,045 Mb的玉米基因组中达到了74.6%。这类可以通过逆转录过程不断复制、插入到基因组中的“寄生”序列与众所周知的艾滋病毒有相同的进化起源,它们的表达受到表观遗传等机制严格控制。在植物基因组中,它们通过持续不断地进行不等重组、短片段删除等方式移除这些序列给基因组带来的额外负担。它们有较高的突变率,是基因变异的重要来源。它们不仅参与了基因组的表观调控和异染色质结构的形成,还可能介导基因的进化和新基因的形成,是植物基因组进化的重要驱动力。然而,由于其序列非常复杂、高度可变且大多位于基因组异染色质区域。迄今我们对其在植物物种形成过程中基因组进化的贡献知之甚少。
2014年高立志研究员带领的研究团队首次完成了多达五个稻属AA基因组(尼瓦拉野生稻 Oryza nivara、非洲栽培稻 Oryza glaberrima、短舌野生稻 Oryza barthii、展颖野生稻Oryza glumaepatula和南方野生稻 Oryza meridionalis)图谱的绘制(Zhang Q J, Zhu T, Xia E H, et al. Rapid diversification of five Oryza AA genomes associated with rice adaptation. Proceedings of the National Academy of Sciences, 2014, 111(46): E4954-E4962.)。该项重要成果在国际上首次构建了包括水稻的稻属植物AA-基因组物种的比较与进化基因组学研究框架,在基因组水平上获得了在物种形成过程中近缘植物基因组与基因变异及进化式样的崭新认识。
加上研究组后续完成的两个野生稻(普通野生稻 Oryza rufipogon和长雄蕊野生稻 Oryza longistaminata)基因组,使得研究组首次可以对约4.8 百万年内产生的8个稻属AA基因组物种开展比较基因组学研究,深入地分析这些快速分化形成的近缘物种基因组中LTR逆转录转座子家族的分化、扩增、删除等进化式样与机制。基于8个稻属AA基因组物种中鉴定得到的3911个完整的LTR逆转录转座子分成了790个家族后,高立志研究组对高拷贝家族的生命周期进行了详细的研究。结果显示,与Ty1-copia相比, Ty3-gypsy超家族的LTR逆转录转座子在稻属AA基因组物种分化的过程中,经历了更多的独立扩增,它们的扩增峰均在亚洲栽培稻与普通野生稻分化以后。基于重测序的reads mapping分析表明,它们中一些新近活跃的Ty3-gyps家族在基因组中占据了较大的比例。对LTR逆转录转座子家族系统发育分析以及序列插入时间的估计表明,一些古老分支上的家族在物种分化的某些时间节点又再度获得了活性并逐渐扩增,但可能随着宿主控制机制的启动,部分家族又逐渐失去了转座活性回归沉默。例如,OAL002跨越了整个稻属AA基因组物种的分化时期,OAL005、OAL006等家族虽然在稻属AA基因组物种的共同祖先中具有活性但是在亚洲栽培稻中失去了活性,而年轻的OAL011家族仅在亚洲栽培稻、普通野生稻和非洲野生稻中可以找到(图1A)。更有趣的是,一些非自治家族(本身不编码转座所需的蛋白、依赖于其它家族编码的蛋白完成转座过程)的寄生式扩增加速了一些活跃家族的衰落(图2)。在0.5 Myr以前具有完整逆转录所需基因的RIRE2家族比依赖其编码基因进行转录的Dasheng家族的拷贝数高,但随着Dasheng家族的拷贝数逐渐超越RIRE2,这两个家族可以编码逆转录所需基因的序列比例将越来越少,最终它们都将逐渐失去转座活性。上述研究结果首次勾画了逆转录转座子家族在稻属AA基因组物种近期分化的约4.8 百万年中生活史周期的快速流转(turnover)与生生不息的图景。它们不止导致了水稻基因组结构的变异与进化,而且在水稻物种形成和多样性过程中影响水稻功能基因的表达与功能分化起到了非常重要的作用。
作为迄今对植物物种形成过程中LTR逆转录转座子家族的近期快速进化推动了基因组进化的首次报道,上述成果在2017年6月以 “Rapid and recent evolution of LTR retrotransposons drives rice genome evolution during the speciation of AA- genome Oryza species”在美国遗传学会主办的G3: Genes, Genomes, Genetics 2017 7: 1875-1885发表。(文章链接)
论文发表后美国遗传学会专门对这一重要研究成果予以重点点评:“Lineage specific retrotransposons shaped the genome evolution of domesticated rice”(文章链接)
图1 23个最大LTR逆转录转座子家族在稻属AA基因组 8 个物种中的生命周期扩增式样
图2 逆转录转座子代表家族在稻属AA基因组8个物种的系统发育关系
图 3 在稻属AA基因组 8 个物种中Ty1-copia 和 Ty3-gypsy 逆转录转座子家族的序列特征
图 4 最大的逆转录转座子家族 OAL001 在稻属AA基因组 8 个物种中的进化动态
图 5 第二大的逆转录转座子家族 OAL001 在稻属AA基因组 8 个物种的进化动态