打不过就加入 | 动植物泛基因组研究(一)

发布于:2023-09-14 ⋅ 阅读:(67) ⋅ 点赞:(0)

一、泛基因组概念

1.1 定义

泛基因组指一个生物分支(如一个物种)的全部基因组信息[1]。泛基因组的英文是Pan-genome,Pan来自希腊词汇 παν,意思是“全部的”[2]。

1.2 发展史

自2005年泛基因组概念在微生物中被首次提出,到2014年作物中开启泛基因组研究,迄今已有数十种动植物开展了泛基因组测序研究,包括人、猪、大豆、水稻、玉米、番茄等[1]。

图片

图 泛基因组研究发展时间史[1]

一个个体的基因组只是物种基因组的代表,并不能全面的反映物种基因水平的全部遗传信息,以此为参考基因组研究同一物种中差异巨大的不同亚种、变种或者不同品系可能会遗漏样本特有表型的遗传信息。因此,未来泛基因组将逐渐取代单一参考基因组,成为研究动植物进化、选择、基因功能和育种的“新标准”[3,4]。

图片

图 泛基因组将超越现有的参考基因组

(图片来源:https://www.nature.com/articles/d42859-020-00115-3)

1.3 分类

泛基因组大体上可分为核心基因组和非核心基因组[1]。核心基因组由所有样本中都存在的序列组成,一般与物种生物学功能和主要表型特征相关,反映了物种的稳定性。

非核心基因组由仅在单个样本或部分样本中存在的序列组成,一般与物种对特定环境的适应性或特有的生物学特征相关,反映了物种的特性。 

图片

图 泛基因组的组成[1]

也有研究会依据观察到的不同基因频率对上述分类进一步细分为Soft core、Private或者Shell、Cloud等分类定义[5,6]。

图片

图 泛基因组的组成细分示意[5]

另外根据是否可以通过足量的测序个体来预测泛基因组的理论大小,将其分为开放型和闭合型。闭合型泛基因组,对足够数量的个体进行测序,几乎可以获得全部基因序列信息,可以预测泛基因组的理论大小。相反,开放型泛基因组大小随着测序个体数量的增加而增加,无法预测最终的泛基因组大小[1]。

图片

图 闭合型和开放型泛基因组

(图片来源:https://en.wikipedia.org/wiki/Pan-genome)

二、泛基因组的构建

2.1 材料选择

样本数量是影响泛基因组规模的重要因素,鉴定新基因的个体数目增加,泛基因组的大小也随之增加,但核心基因的百分比随之下降(见下图)。材料特性也是重要因素之一,亲缘关系近的材料会降低泛基因组的大小,而野生和栽培种质结合研究可产生更大规模的泛基因组。除上述因素外,泛基因组的规模和组成还受到物种的倍性水平、繁殖方式、驯化程度等多个因素影响[7]。

图片

图 主要作物中的泛基因组研究比较[7]

对于大多数常规泛基因组项目,建议选择能充分反映物种遗传和表型多样性,以及各进化位置关系的材料进行测序研究,可基于经验或群体结构信息(通常参考前期研究)选择最具代表性的个体进行泛基因组构建[8]。例如,在最近发表的狗尾草属泛基因组研究中,作者从头组装了110个代表性基因组,包括35个野生、40个地方品种和35个现代栽培品种[5]。“这些品种基于系统发育关系、地理分布、繁殖和/或研究用途和亚群分布进行选择,以确保它们代表了狗尾草和绿色狗尾草内遗传多样性的全谱。我们选择的这些品种也涵盖了表型多样性,并代表了与驯化和改良相关的表型连续体。”

图片

图 狗尾草属泛基因组研究材料选择[5]

2.2 测序方法

限制泛基因组广泛开展的一个重要限制因素是测序技术和成本。与Illumina等短读长测序相比,PacBio/Nanopore三代长读长测序技术不论在基因组组装连续性还是结构变异检测上均具有显著优势[2,4]。随着三代测序技术持续降本增效,基于此技术的泛基因组研究如雨后春笋。特别是PacBio HiFi测序在T2T基因组组装上持续输出,已成为(泛)基因组研究的首选平台[2,4]。

图片

图 植物泛基因组研究测序技术时间线[8]

2.3 构建方法

动植物泛基因组构建目前常用的方法包括迭代组装(Iterative assembly)、Map-to-pan、从头组装后比较(De novo assembly and comparison)和图形泛基因组(Graph pan-genome)等[2,3,9]。

图片

图 泛基因组主要构建方法[2]

迭代组装和Map-to-pan方法都依赖于已有的参考基因组,通过将短读长比对到参考基因组上鉴定基因的PAVs(presence/absence variants),这种方式优点是成本低,缺点则是对于结构变异检出效果不佳,多见于早期的泛基因组研究。

从头组装后比较的方法分别对个体基因组进行高质量组装,然后通过比较基因组进行泛基因组研究。该方法不依赖参考基因组,能够更全面的获得个体基因组特异性序列。

图形泛基因组是在基因组从头组装的基础上,将个体基因组及其变异表示为图形结构。与传统线性基因组相比,图形泛基因组可存储和展示物种全部的遗传信息及序列结构变异,更有利于群体基因组研究,正成为泛基因组研究的主流方式[10]。关于图形泛基因组更为详细的构建方法学介绍如老师感兴趣可参考两篇引文综述[11,12],在此不作展开。

图片

图 泛基因组构建方法比较[13]

三、泛基因组的应用

泛基因组研究可获得核心基因(组)和非核心基因(组)等基本特征数据,更可以得到物种全面而准确的变异信息(SNP、Indel、CNV、PAV等)。相比于重测序研究,基于长读长的泛基因组能大幅度提高大片段结构变异(SV)的检出率和准确性,并揭示其对关键表型基因的影响[7]。

图片

图 主要作物中结构变异影响重要农艺性状及相关基因[7]

总之,泛基因组图谱提供的复杂全面基因组变异,有助于研究物种的起源及演化、解析物种表型性状的多样性、发掘重要性状相关的基因资源等重要生物学问题,并最终帮助我们找回物种丢失的遗传多样性,选育更好的品种[2,14,15]。

图片

图 泛基因组对科学研究与育种的应用[14]

图片

图 泛基因组应用于育种[15]

下一期小编将结合文献对泛基因组的主要研究方向做介绍,欢迎交流。

1. Golicz, A.A., et al., Pangenomics Comes of Age: From Bacteria to Plant and Animal Applications. Trends Genet, 2020. 36(2): p. 132-145.

2. Shi, J., et al., Plant pan-genomics and its applications. Mol Plant, 2023. 16(1): p. 168-186.

3. Bayer, P.E., et al., Plant pan-genomes are the new reference. Nat Plants, 2020. 6(8): p. 914-920.

4. Huang, X., et al., The integrated genomics of crop domestication and breeding. Cell, 2022. 185(15): p. 2828-2839.

5. He, Q., et al., A graph-based genome and pan-genome variation of the model plant Setaria. Nat Genet, 2023. 55(7): p. 1232-1242.

6. Li, N., et al., Super-pangenome analyses highlight genomic diversity and structural variation across wild and cultivated tomato species. Nat Genet, 2023. 55(5): p. 852-860.

7. Tao, Y., et al., Exploring and Exploiting Pan-genomics for Crop Improvement. Mol Plant, 2019. 12(2): p. 156-169.

8. Li, W., et al., Plant pan-genomics: recent advances, new challenges, and roads ahead. J Genet Genomics, 2022. 49(9): p. 833-846.

9. Danilevicz, M.F., et al., Plant pangenomics: approaches, applications and advancements. Curr Opin Plant Biol, 2020. 54: p. 18-25.

10. Tao, Y., D.R. Jordan, and E.S. Mace, A Graph-Based Pan-Genome Guides Biological Discovery. Mol Plant, 2020. 13(9): p. 1247-1249.

11. Wang, S., et al., Graph-based pan-genomes: increased opportunities in plant genomics. J Exp Bot, 2023. 74(1): p. 24-39.

12. Eizenga, J.M., et al., Pangenome Graphs. Annu Rev Genomics Hum Genet, 2020. 21: p. 139-162.

13. Gong, Y., et al., A review of the pangenome: how it affects our understanding of genomic variation, selection and breeding in domestic animals? J Anim Sci Biotechnol, 2023. 14(1): p. 73.

14. Raza, A., A. Bohra, and R.K. Varshney, Pan-genome for pearl millet that beats the heat. Trends Plant Sci, 2023. 28(8): p. 857-860.

15. 赵均良, 张少红, and 刘斌, 泛基因组及其在植物功能基因组学研究中的应用. 植物遗传资源学报, 2021. 22(01): p. 7-15.