马铃薯(Solanum tuberosum L.)是世界上第三大作物,也是对粮食安全最重要的非谷类作物。许多马铃薯基因组已被测序和组装。然而,由于野生马铃薯显示出可变的倍性水平,并且由于多倍体基因组序列解析难度大,迄今为止缺乏更大的马铃薯基因组研究,并且没有泛基因组(Pan-genome)组装可以整合。泛基因组是一个物种内所有基因组信息的总和。泛基因组相比单一参考基因组,包括了更多的遗传多样性,可以有效降低参考基因组偏差对遗传变异检测的影响。泛基因组可以回答更大相关性和适应性的问题,并提供有关兴趣分组多样性的更多信息。
近日,麦吉尔大学的Martina V. Strömvik团队,在《Proc. Natl. Acad. Sci. U.S.A.》杂志发表了题为“Pangenome analyses reveal impact of transposable elements and ploidy on the evolution of potato species”的文章。作者组装了一个基于不同物种、地方品种、栽培品种和商业品种的 296 个二倍体和多倍体种质序列的马铃薯泛基因组,代表了迄今为止最具分类群包容性的马铃薯泛基因组。发现转座元件(TEs)在进化分支之间有所不同,并且在体外繁殖的种质中尤为普遍。构建支持以前的分类分组的系统发育树,并揭示与适应环境,气候变化和栽培实践有关的基因功能,此外还对TE和物种形成提供了见解。
作者从公开获得的33份材料种质基因组直接用于泛基因组构建,而其余种质则从头组装,总共产生154 Gbp的重叠群。短读组件的 N50 值在 1393 到 16809 bp 的范围内,而长读取组件具有更好的连续性和完整性。所有非参考序列都被添加到参考基因组中,以形成马铃薯泛基因组部分。泛基因组由 12 条染色体加上 5,148,884 个重叠群组成,总大小为 9.05 Gbp。
图1 野生马铃薯泛基因组。
蛋白质编码基因的获得与缺失变异(PAV)变异。PAV可以识别单个种质之间的基因多样性和变异。一些泛基因组研究已经成功地使用PAV数据来了解基因含量变异及其在人群之间的影响。在马铃薯泛基因组中观察到更多的可变基因和非常少的核心基因,证明了野生马铃薯中存在的变异性,正如之前在泛转录组研究中显示的那样,总共报告了96,886个非冗余代表性转录本,并且品种特异性基因的数量大于仅组装四种马铃薯基因型的核心基因数量结节链球菌组和三个四倍体组。(图1)
图2 基于PAV的野生马铃薯泛基因组中包含的种质基因的量。
与地方品种和栽培品种相比,野生物种的平均基因数量要低得多。与二倍体相比,多倍体具有更多的基因,并且二倍体栽培品种比二倍体野生物种具有更多的基因,表明马铃薯基因含量的增加主要是由倍性驱动的,驯化和育种也起到了一定作用。(图2)
图3 利用野生马铃薯的泛基因组的PAV数据构建的最大似然系统发育树。
根据基因含量对种质进行聚类。PAV数据用于构建最大似然系统发育树,以将基于PAV的分组与马铃薯中现有的分支概念进行比较。基于PAV的系统发育中的种质遵循先前分类的进化枝1 + 2,3和4。分支 4 被细分为南北分支 4。所有以前被归类为分支3种的种质都归为一组,除了模棱两可的物种。后者以前被认为是一个分支4物种或标记为分支3,目前的树将其置于分支3和分支4之外,属于一个单独的组,类似于先前研究中报告的内容。(图3)
PAV的主成分分析(PCA)也显示出与系统发育树相似的分离。观察到进化枝1+2,进化枝3和进化枝4物种的明确分离,S. sogarandinum和S. cajamarquense种质作为一个单独的组。南部野生物种与其他分支4物种形成一个单独的集群。观察到包括野生进化枝4北种和栽培物种在内的紧密聚集。随后的分析排除了S. sogarandinum和S. cajamarquense从分支3中。
图4 分析野生马铃薯泛基因组中的不同分支和亚群。
基因含量的变化区分了分支和亚组。作者为了了解种质之间共享基因数量的差异,生成热图,热图显示了加入物与其他种质共有的基因数量。对于三个分支中的每一个,与分支之间的种质相比,一个分支内的种质具有更多的共同基因。PAV数据还用于比较1个进化枝(2+3、4和68进化枝)之间的基因含量。比较进化枝特异性核心基因含量表明,每个进化枝的核心基因组之间存在相似的功能共享。(图4)
图5 从头基因组组装的箱线图和指定组之间的TE数量。
泛基因组中的TE含量。泛基因组由75.5%的Tes组成,基因含量分析表明云基因组和体外亚组中DNA甲基化和TE的基因的功能富集。扫描成员加入组件的TE含量和转位相关基因的存在(图5)。在确定的TE数量上,装配质量没有偏差。
面对气候变化,马铃薯作物的未来生存取决于我们对生物多样性的保护以及我们对如何将多样性引入当前和发展中的品种的理解。在这里,作者提出了一个全面的泛基因组,由野生马铃薯中代表296个物种的60个种质构建而成。对泛基因组的分析为获得与缺失变异(PAV)在野生马铃薯的物种形成中的作用提供了证据,特别是转座元件变异,并揭示了体外繁殖材料中转座元件相关含量增加的趋势,类似于由于压力引起的自然适应中转座元件活性的增加。