Nature:淀粉酶基因座的循环进化和选择形态结构多样性

学术   2024-09-30 23:52   上海  


         

 

         

 

论文ID

题目:Recurrent evolution and selection shape structural diversity at the amylase locus

期刊:Nature

IF:69.504

发表时间:2024年9月4日

通讯作者单位:加州大学

DOI:https://doi.org/10.1038/s41586-024-07911-1

主要内容:

自从农业出现以来,人类已经进化到更容易消化淀粉。人类基因组中含有编码淀粉酶酶的基因的区域,这些酶对淀粉消化至关重要,显示出广泛的结构多样性。淀粉酶基因在人类历史上被复制和删除了多次,在农业出现后,包含基因复制版本的结构受到自然选择的青睐。

饮食是自然选择的重要驱动力。例如,在大约 10,000 年前产奶动物被驯化后,一种使人们能够在成年后消化牛奶的遗传变异在人类中传播。同样,大约 12,000 年前开始采用农业引发了各种人群向富含淀粉的饮食的过渡。

在人类中,淀粉的消化是由 α-淀粉酶实现的,这些酶由淀粉酶基因座(基因组区域)中的三个相邻基因编码。所有三个基因都显示出拷贝数的差异,较高的拷贝数与消化淀粉的能力增加相关。然而,这些基因复制的结构和进化历史是未知的,并且无法仅通过对短 DNA 片段或读数进行测序来评估。使用人类泛基因组参考联盟 (HPRC) 生成的长读长基因组组装,现在可以解决淀粉酶基因复制的结构多样性和选择性影响。    

为了表征淀粉酶基因座的复杂结构,作者检查了来自 HPRC 基于长读长的基因组组装的近 100 个单倍型(从一个亲本一起继承的 DNA 片段)。使用这些序列,作者构建了一个“泛基因组图”:这些单倍型中淀粉酶基因座存在的遗传变异的数学表示。然后,作者寻找在单倍型中和单倍型之间共享的序列特征。作者鉴定了 28 种不同的单倍型结构,每种结构都有不同的序列特征和淀粉酶基因拷贝的组成和配置。

接下来,作者使用结构可变淀粉酶基因座两侧序列中的遗传标记构建了一个进化树。这棵树代表了单倍型之间的进化关系,使作者能够追踪和确定不同结构的出现日期。作者发现,相似甚至相同的结构在历史上已经出现过多次,并且不同的淀粉酶基因被反复复制和删除(图 1a)。这种“递归进化”可能解释了以前使用短读长数据检测淀粉酶基因座选择信号的挑战。

最后,为了解决自然选择问题,作者开发了一种方法来识别使用短读长测序的个体基因组中存在哪些结构。通过将这种方法应用于来自欧亚大陆西部的古代人类遗骸(可追溯到 12,000 至 250 年前)的基因组,作者发现具有更多基因重复的单倍型在过去 12,000 年中频率迅速增加。使用三种互补方法,作者发现这种频率增加最好地解释为在欧亚大陆西部采用农业后对更高拷贝数的淀粉酶基因的正向选择(图 1b)。

作者的研究结果强调了过去 12,000 年饮食和农业对人类进化的影响,并强调了结构变异作为自然选择所针对的遗传多样性关键来源的作用。他们进一步表明,长读长、群体规模、单倍型解析的基因组组装和基于泛基因组的方法对于解析与适应相关的复杂基因组区域至关重要。

然而,作者的研究能够直接观察到仅约 100 个单倍型(即近 50 个个体)的结构结构,几乎没有触及全球种群遗传变异的表面。不断努力增加来自不同群体个体的长读长基因组的代表性,无疑将揭示淀粉酶位点及其他部位的进一步结构多样性。

尽管来自欧亚大陆西部的古代人类基因组使作者能够探索世界这一地区的选择,但农业在人类历史上已经被独立采用过几次。为其他古代人类遗骸生成基因组将有助于进一步研究与这些农业替代起源相关的选择。此外,虽然不是作者研究的重点,但与人类共存的几种动物物种的基因组也表现出相对较新的淀粉酶基因重复,可能与农作物的驯化有关。未来的研究可能会阐明这些物种和人类基因组结构的变化与饮食变化之间的相似之处。    

原文链接:https://www.nature.com/articles/s41586-024-07911-1    



 


 国自然试听课来扫码申请!

 

 

 本次国自然试听课全程录像,如需要回看录像的,请扫码下方二维码免费领取


生物医学科研之家
医药加旗下订阅号,致力于提高中国生物医药科研人员的创新能力。医药加网络课堂与视频号做技术分享,再通过实操学习班做科研培训!医药加通过20多门课程已经培训出上万学员,上百位国自然小同行评审专家,为广大学员,做一对一评审与修改。
 最新文章