作者构建并表征了竹子(moso bamboo)的单倍型基础全基因组图谱,旨在揭示其遗传变异及气候适应性。
文章首先展示了如何通过等位基因比较的方法构建竹子的单倍型基础全基因组,研究结果表明,竹子在不同地理区域呈现出显著的遗传多样性。这种多样性与地理适应性有密切关系,可能影响竹子的生长和分布特征。
在结果部分,研究者们对不同组织(叶、茎、根、地下茎)之间的基因表达进行了比较,发现特定单倍型在特定条件下具有优越的适应能力。这为未来的培育和改良提供了信息。对基因组的不同区域(如CDS、UTR和内含子)分析也揭示了关键基因和调控元件,为深入理解竹子的生物学机制奠定了基础。此外,研究还强调了气候因素对竹子生长的影响,指出气候适应性可能是通过遗传变异实现的,这为研究植物如何应对全球气候变化提供了重要的资料和思路。
主要结果
16个典型毛竹种质的基因组测序及变异识别
研究者们首次对来自中国不同地理区域的16个毛竹代表种质(representative moso bamboo accessions, RMAs)进行了基因组测序。这一工作旨在捕捉毛竹广泛的遗传多样性。
研究团队对所有RMAs进行了de novo基因组测序,生成了1.03 Tb的PacBio HiFi读取数据,平均测序深度为33.74×,最终构建了16个高质量的基因组组装(32个单倍型组装),其平均N50长度为57.0 Mb。在质量方面,最终组装的平均质量值为64.26,k-mer完整性达98.20%。研究中观察到所有组装的平均开关错误率为5.44%。
为了进一步增强组装质量,研究者们利用了Hi-C测序技术,对三个RMAs(CY、HB和HZP)进行了染色体级别的基因组组装,平均测序深度达到139.24×。通过Hi-C相互作用,研究者们成功将99.07%的序列锚定到假染色体上,完成了对组装序列的校正和排序。
大部分的亚种间杂交变异发生在单倍型之间,而不是在品种内部
研究者们发现,毛竹的遗传变异主要存在于不同单倍型之间,而不是在单个种质内部。具体而言,作者指出,通过对16个代表性种质的比较,平均有97.0%的杂合变异同样存在于参考基因组单倍型之间,这些变异被称为“单倍型间变异”(inter-haplotype variation),而与种质间的变异(inter-accession variation)相比,单倍型间的变异显著更为丰富。
令人注目的是,研究还透露了单倍型间短变异和结构变异的数量分别比种质间短变异和结构变异高出10.4倍和5.3倍。具体来说,所有识别的短变异的平均杂合度为98.6%,而种质间短变异的平均杂合度仅为71.2%。这表明,传统的变异识别方法可能高估了毛竹的遗传多样性。
此外,鉴于毛竹的无性繁殖和67年的开花周期,学者们推测,单倍型间的变异可能来源于原始单倍型之间的差异,而不是由于种质间的遗传物质交换不足。该研究因此提供了关于毛竹遗传变异的重要见解,指出传统方法在估算遗传多样性时可能存在局限性。
ps:第一次遇到小标题是结论的(还是看文献看的少~~~)
基于单倍型的毛竹全基因组的构建与表征通过等位基因比较
(1)组装和变异识别:研究表明,毛竹不同单倍型的构建提供了丰富的遗传信息,表明大多数遗传变异发生在单倍型之间而非种质内。这一发现强化了对毛竹遗传多样性的理解,并为后续筛选和保护措施提供了重要基础。
(2)数据总览:在不同的段落,提到基因组的特定大小,其中有提到80 Mb和20 Mb的组装结果,可能代表不同区域或特定基因组特征的测定。
(3)单倍型分析:研究还详细描述了两个主要单倍型(Haplotype 1和Haplotype 2)的特征,对比分析显示不同单倍型之间的遗传差异,为理解毛竹的适应性和遗传适应机制提供了新视角。
(4)遗传变异的分布:分析表明,短变异和结构变异的数量主要集中在单倍型之间,这为研究基因组的适应性进化提供了充分的证据,反映出毛竹在进化过程中的适应特征和环境响应。
等位基因特异性基因表达在毛竹环境适应中的作用
(1)等位基因特异性表达的识别:研究发现共有16,317个基因表现出等位基因特异性表达(Allele-specific expression, ASE),这些基因分布在8730个基因集中。其中,最大比例的基因组属于核心-可变基因集(34.1%),而最少的基因组(0.3%)则属于可丢弃的双基因集。
(2)种质间特异性:结果显示,这些等位基因特异性表达基因组具有显著的种质间特异,81.8%的基因组仅在1至2个种质中被检测到,而仅有9个ASEGs(allele-specific expression gene sets)在所有种质中共享。
(3)组织特异性表达模式:在针对组织特异性表达的分析中,3149个在两个或多个种质中被检测到的等位基因特异性表达基因组中,72%表现出种质间的组织特异性,而28%则在所有种质中展现出一致的组织表达。具体来说,最高比例的等位基因特异性表达基因组(39.3%)在所有组织中表达,其次是仅在叶子(13.4%)、根(6.1%)、茎(5.1%)和地下茎(4.9%)中特异性表达的基因组。
(4)功能富集分析:对这些基因的功能富集分析显示,它们与各种刺激和防御反应相关。例如,在所有组织中表达的基因主要富集在与蛋白质合成和修饰相关的过程,而组织特异性表达的基因则涉及发育过程,如叶子的蜡生物合成过程和茎的细胞壁生物发生。
与生物气候变量相关的基因组变异识别
(1)基因型-环境关联分析:研究者们通过基因型-环境关联(GEA)分析,以识别与气候适应相关的基因组位点。分析基于从图式泛基因组(graph-based pangenome)中识别的结构变异(SVs)和从427个先前生成的重测序毛竹种质中检测到的小变异(SNPs和InDels)进行。
(2)环境变量的选择:使用来自WorldClim的19个气候生物变量(BIO),包括11个与温度相关的变量和8个与降水相关的变量,进行分析。研究者首先通过SNPs确认了种群结构,并发现相应的K值为1,这与先前的研究结果一致。
(3)显著变异的检测:初步分析通过LFMM2方法识别出96,638个SNPs、7,456个InDels和449个与气候生物变量显著相关的SVs,FDR校正后的P值均小于0.05。在基于变量相关性与梯度森林(GF)排名的分析中,选择了六个主要的气候变量(年均温度、日温差、最热月的最高温度、湿季的平均温度、最干月的降水量和降水季节性)进行进一步的冗余分析(RDA)。
(4)适应性变异的识别:最终,研究识别出1050个与气候生物变量关联的适应性变异,包括958个SNPs、90个InDels和2个SVs。这些变异代表了毛竹气候适应的核心基因组变异。具体而言,与温度相关的变异(996个)显著多于与降水相关的变异(123个)。
(5)气候影响的贡献:RDA结果表明,气候效应的贡献解释了适应性变异中35%的遗传变异,这一比例显著高于地理因素的贡献。
预测弱势的毛竹群体
(1)风险计算:研究使用了与气候相关的变异和未来气候预测,计算了不适应风险(RONA),该指标表示毛竹适应未来气候条件所需的预期等位基因频率偏移量。分析考虑了四个气候模型(如ACCESS-CM2、CMCC-ESM2等)在两种共享社会经济路径(SSP)的情景下:低排放(SSP126)和高排放(SSP585)情景。
(2)情景比较:结果表明,在高排放情景(SSP585)下,RONA值高于低排放情景(SSP126)。对于与温度相关的变量,RONA值一般高于降水相关变量,表明温度变化对于毛竹适应性的影响更为显著。
(3)特定区域的风险:分析显示,在BIO5(最热月的最高温度)预测下,某些区域(如西北部)表现出较高的RONA值,尤其是XN地区可能面临到达最高温度和最大加热的风险。这些结果强调了中西部地区在未来高温事件中保护措施的重要性。
(4)适应性风险警示:研究指出,在高排放情景下,毛竹种群面临显著的适应风险,尤其是在北部和西北部区域。这强调了减排措施的重要性,以减轻气候变化对毛竹生存的压力。针对这些高风险的区域,研究者建议优先进行栖息地恢复,并考虑北方种群的辅助迁移。
(5)样本和数据的局限性:研究中仅包括了中国毛竹的主要自然分布区域的样本,未涵盖一些人工种植或极端种群。因此,补充这些样本可能有助于进一步识别适应极端环境的变异。
讨论
在讨论部分,作者深入探讨了多项研究结果及其对于毛竹(Moso Bamboo)环境适应的重要性。
(1)气候适应性与基因组变异:对于与气候生物变量相关的基因组变异,该研究识别出多种显著变量。特别是在高排放情景(SSP585)下,毛竹种群面临较高的不适应风险(RONA),表明温度变化对其适应性的影响更为显著。这指出了未来高温对某些地区(如西北部)的潜在威胁。
(2)局部适应性分析:文章提到在特定地区(如HZP和WYS)进行的局部适应性研究,强调了这些地区在气候变化情境下的特殊需求和适应策略,这为未来的保护和恢复工作提供了重要依据。
(3)保护措施建议:针对脆弱的毛竹种群,研究者建议应优先进行栖息地恢复,并考虑北方种群的辅助迁移,以应对气候变化带来的挑战。同时,强调了适度减排的必要性,以减轻气候变化对毛竹生存的压力。
(4)现有研究的局限性:研究也承认了样本的局限性,指出仅覆盖了中国毛竹的主要自然分布区域,未包含人工种植或极端种群等情况,未来可以通过补充这些样本进一步丰富研究结果。
文献来源:
Hou Y, Gan J, Fan Z, Sun L, Garg V, Wang Y, et al. Haplotype-based pangenomes reveal genetic variations and climate adaptations in moso bamboo populations. Nat Commun. 2024, 15:8085.