草莓是倍受人们喜爱的浆果类水果,也是最为年轻的驯化作物之一。我国草莓栽培面积居世界首位,且云南是夏季草莓的主产区。我国草莓野生种质资源较为丰富,西南地区是草莓属的分化中心之一。草莓属植物存在广泛的种间杂交与多倍体化,使得其细胞器基因组起源、核质互作演化等方面的研究仍存在很大程度的未知,也阻碍了草莓野生种质资源的有效评估与利用。
遗传多样性的形成与维持机制是进化基因组学的核心问题之一。相对于叶绿体基因组而言,植物线粒体基因组一般具有结构复杂多样、替代速率较低、重组频繁等特点,被认为是研究基因组结构与功能演化的重要遗传系统。早期的研究表明,植物线粒体基因组的结构变化非常快,但序列水平的变化却很慢。然而也有学者认为,线粒体基因组编码区和非编码区可能存在不同的选择压或突变修复机制,从而导致这两个区间的演化速率存在差异。
为了更好地理解植物线粒体基因组演化特征与机制,中国科学院昆明植物研究所朱安丹专题组和李德铢专题组完成了13个草莓属野生种完整的线粒体基因组组装,并对其编码区与非编码区序列变异特征进行了深入研究。研究发现:(1)DNA突变速率在线粒体基因组编码区和非编码区基本一致,但非编码区的插入缺失(indels)和倒位(inversions)发生频率更高。该结果也纠正了一些学者误认为“非编码区的序列突变速率更快”的观点。(2)植物线粒体基因组重组频繁,即使是同一属内亲缘关系较近的物种之间,线粒体基因组的结构也存在很大差异。(3)草莓属线粒体基因组中存在大量的由于“微倒位”(micro-inversion)引入的多碱基连锁突变(2-18 bp),而这些连续性突变位点可能会对替代速率的计算或系统发育信号的评估产生影响;同时这也拓展了进化基因组学中通常认为碱基替代都是独立发生的观点。(4)植物线粒体基因组共线性较低很可能是由于大量DNA序列的获得或丢失造成的。
上述研究成果以Fragaria mitogenomes evolve rapidly in structure but slowly in sequence and incur frequent multinucleotide mutations mediated by micro-inversions为题,发表在国际植物学主流期刊New Phytologist上。这也是该团队继2020年发表植物线粒体基因组替代速率异质性的研究(Liu & Fan, et al., 2020, New Phytologist)之后,关于植物线粒体基因组演化方面的又一重要研究成果。中国科学院昆明植物研究所樊维姝博士和刘芳博士为第一作者,朱安丹研究员、李德铢研究员和美国内布拉斯加大学林肯分校Jeffrey P. Mower博士为通讯作者。云南省农业科学院阮继伟研究员和沈阳农业大学雷家军教授也参与了本项目。该项目得到了国家重点研发计划(2018YFD1000107)、种质库开放课题以及中科院“西部之光”等项目的支持。
图1. 草莓属线粒体基因组中编码区和非编码区的替代速率
图2.草莓属线粒体基因组中广泛存在由微倒位介导的连续碱基突变