世界人民最爱-阿拉比卡咖啡基因组发布!梳理其起源、进化历史及筛选抗病候选基因

学术   2024-11-08 08:46   河南  

咖啡是大家非常喜爱的饮品,但你可知,咖啡每年产量约为1000万吨,是世界上贸易量最大的商品之一,其中阿拉比卡咖啡因其美妙的口感和浓郁的香气而备受推崇,在全世界咖啡爱好者的心中占有重要的地位,同时也是年产量最高的咖啡品种。

阿拉比卡咖啡

阿拉比卡咖啡(Coffea arabica)源自埃塞俄比亚的高原地带,传说阿拉比卡咖啡的发现归功于一位名叫卡尔迪的山羊牧民,该牧民注意到他的羊群在食用这些咖啡浆果后变得异常活跃,从而揭示了咖啡果所具有的提神效果。随后,阿拉比卡咖啡的种植技术从埃塞俄比亚传播至阿拉伯半岛,并在阿拉伯商人之间赢得了声誉。时至15世纪,咖啡种植已扩展至也门地区,为Qahveh Khaneh咖啡馆的兴起奠定了基石,使得咖啡成为了当地社会与文化生活中不可或缺的一部分。

咖啡幼嫩果实

阿拉比卡咖啡(Coffea arabica)是一种异源四倍体(2n=4x=44),源自两个二倍体祖先物种——中粒咖啡(Coffea eugenioides,2n=2x=22)与罗布斯塔咖啡(Coffea canephora,2n=2x=22)的自然杂交。阿拉比卡咖啡的多倍体化事件相对较新,其演化历程中遭遇了显著的遗传瓶颈,导致其栽培品种呈现出较低的遗传多样性。这一特征在基因组层面上体现为阿拉比卡咖啡栽培品种间缺乏足够的多样性,进而对其环境适应能力和病虫害抵抗性构成了严峻挑战。特别是在抗逆性状方面,阿拉比卡咖啡对诸如咖啡叶锈病等众多植物病虫害尤为敏感。因此,深入探究阿拉比卡咖啡的起源、繁育历程、遗传多样性,以及评估抗性基因引入对其品质及其他性状的影响,对于优化阿拉比卡咖啡栽培品种、提升其抗性和品质而言,具有至关重要的意义。

采收的咖啡豆

近日,新加坡南洋理工大学生物科学学院的助理教授Jarkko Salojärvi,在国际顶级期刊Nature Genetics上发表了一篇题为“The genome and population genomics of allopolyploid Coffea arabica reveal the diversification history of modern coffee cultivars”的研究论文。该研究通过对阿拉比卡咖啡(Coffea arabica)、其两个祖先物种——中粒咖啡(Coffea eugenioides)和罗布斯塔咖啡(Coffea canephora)进行染色体级别的基因组组装,深入揭示了这三个物种的基因组结构特征。研究基于咖啡基因组中的多倍体化时间点,探讨了多倍体化过程对基因组的具体影响,以及多倍体物种如何适应并稳定于新的倍性状态。此外,该研究还利用多个咖啡品种的基因组重测序数据,分析了阿拉比卡咖啡的进化历史和传播路径,并成功鉴定了与病原体抗性紧密相关的基因组候选区域。

研究团队采纳了PacBio HiFi数据与Hi-C技术相结合的方式,对阿拉比卡咖啡的基因组进行了精密组装,最终获得了大小为1,198 Mb的基因组序列,其中1,192 Mb(即预测基因组大小的93.1%)被成功锚定至推定染色体上。与此同时,罗布斯塔咖啡(Coffea canephora)与中粒咖啡(Coffea eugenioides)的基因组大小分别为661 Mb和672 Mb。值得注意的是,所有组装中的基因组完整性均超过了96%。BUSCO评估结果显示,在HiFi组装中,有93.2%的BUSCO基因呈现为重复状态,这有力地证明了异源多倍体化事件中大部分重复基因得到了有效保留。

咖啡基因组组装数据统计
进一步地,基于基因组中转座子(TE)的深入分析揭示,中粒咖啡与欧基尼奥伊德斯咖啡的基因组中TE含量分别为67.5%和59.7%。值得注意的是,Gypsy长末端重复(LTR)反转座子构成了这两个物种间TE含量差异的主要部分。然而,在阿拉比卡咖啡的亚基因组subCC和subEE(分别源自中粒咖啡和欧基尼奥伊德斯咖啡的祖先)中,TE含量的差异显著缩小,分别为63.1%和63.8%。这一发现暗示,转座子可能通过异源多倍化事件中的同源重组(HE)机制发生了转移,从而在亚基因组间实现了更为均衡的分布。
阿拉比卡咖啡及其祖先物种中的同系、分化和基因丢失模式
为了深入探究阿拉比卡咖啡的演化历程,研究团队针对46份样本实施了基因组重测序,其中包括3份罗布斯塔咖啡(Coffea canephora)、2份中粒咖啡(Coffea eugenioides)及41份阿拉比卡咖啡(Coffea arabica)样本。基于所获取的重测序数据,研究团队对阿拉比卡咖啡品种间亚基因组(subgenome)的交换程度及其对基因组进化的潜在贡献进行了详尽的分析。值得注意的是,本研究中所有品种在7号染色体的一端均呈现出稳定的等位基因subEE偏倚现象,该区域富含与叶绿体功能密切相关的基因。鉴于阿拉比卡咖啡的质体基因组源自罗布斯塔咖啡,此等位基因交换很可能经历了自然选择,原因是编码叶绿体定位蛋白的核基因与叶绿体基因间可能存在相容性障碍。
阿拉比卡咖啡的种群历史

在等位基因分布方面,多数品种展现出显著的3:1等位基因subCC偏倚。无论是野生还是栽培的阿拉比卡咖啡,均表现出高度一致的杂合性消除(Heterozygosity Elimination, HE)交换模式,这暗示:(1)等位基因偏倚是一种适应性特征,与人工育种活动无直接关联;(2)该偏倚起源于所有采样品种的共同祖先,且可能紧随最初的全基因组多倍体化事件之后。此外,在部分栽培品种中,研究者还观察到了较为新颖的HE交换事件,同样呈现出subCC偏倚的趋势,但BMJM品种是个例外,该品种因1号染色体上发生的单次大规模杂交而表现出subEE偏倚的趋势。
基于上述发现,研究团队提出以下假设:在遗传多样性较低的多倍体物种,如阿拉比卡咖啡中,杂合性消除可能是导致近缘种间表型变异的关键因素。这一假设为理解阿拉比卡咖啡的演化机制及其适应环境的能力提供了新的视角。
基于subCC亚基因组的SNP推断出的亲缘关系评估
此外,本研究采用重测序数据对阿拉比卡咖啡的地理起源进行了深入分析。在大裂谷东侧的野生种群中,观察到了一定程度的杂交现象以及密切的遗传相关性。相比之下,位于大裂谷西侧的杂交相关个体则主要集中分布在Gesha地区。值得注意的是,与栽培品种亲缘关系最近的杂交样本为E016/136,该样本与多个野生样本展现出一级亲缘关系的特征。进一步地,Ar35-06和Eth28.2作为野生种群的纯合代表,与理论推测的阿拉比卡咖啡真正野生亲本之间呈现出最高的遗传接近度。基于上述数据分析,本研究提出Gesha地区是野生样本中具备高度驯化潜力的热点区域。
罗布斯塔咖啡品系向抗咖啡叶锈病的阿拉比卡品系基因组的渗入
阿拉比卡咖啡的自交现象与多重遗传瓶颈可能选择性清除了有害等位基因,同时其高度保守性促进了与中粒咖啡的自发杂交,产生了抗咖啡叶锈病的Timor杂交品种。研究人员对Timor杂交品种与阿拉比卡回交后代进行测序,发现杂交对subCC基因组影响显著,核苷酸差异增加(FST=0.185)。所有Timor杂交种4号染色体上存在共同渐渗区域,包含233个共有基因,其中五个与拟南芥RPP8同源,为NOD-like受体抗性基因,表现出高变异性。此外,还发现了十个CPR1同源基因及三个LRK10L重复基因,LRK10L与叶锈抗性相关。高FST值表明栽培品种与转移系差异显著,但与野生种群差异不大,核苷酸多样性分析进一步支持了野生种群非等位基因不对称性来源的观点,暗示相关基因经历了选择清除。
原文链接:
https://www.nature.com/articles/s41588-024-01695-w

END

让知识分享更顺畅
点击下方图片直达本号精品合集,发现更多知识
组学大讲堂致力于基因组学、转录组学、蛋白质组学、代谢组学等组学知识及生信技能的传播,让知识分享更顺畅!




为了避免我们意外失散
快把“组学大讲堂”设置为星标吧★
只需三步↓↓
点击下方“组学大讲堂”进入公众号主页,点击右上角“...”,设为星标,精彩资讯不容错过!
   测序、数据分析、课程培训等事宜请联系邮箱:Tech@biomics.com.cn 

听说点在看会发大文章


组学大讲堂
生物科学知识,生信技能应有尽有,生物科研工作者必关注!
 最新文章