哈佛医学院Alexander Gusev近日撰文介绍了3种基因环境交互作用(Gene-environment interactions,简称G-by-E或GxE)的主要模型,并特别探讨了社会学概念里的“同型婚配”现象作为一种环境因素对于遗传率的影响。
识别遗传变异与环境之间的相互作用(GxE)一直是人类遗传学中的一项挑战。虽然在其他生物体中这种相互作用较易观察,但在人类中检测到单个遗传变异的影响却显得尤为困难。近期,几项研究试图量化GxE相互作用在全基因组中的整体贡献,并探讨适应这些发现的生物学模型。研究结果表明,在许多情况下,这种影响是微妙的且具有高度的多基因特性。
基因变异是如何与环境相互作用的?
首先,让我们明确一些概念。遗传学家通常将“环境”(E)定义为任何非遗传因素直接影响的过程:传统的环境暴露如污染被归类为“环境”,而吸烟等行为习惯、家庭养育或遗产传承,乃至年龄和性别等内源性因素也视为“环境”的一部分。其次,当两种影响因素结合产生的效果不等于它们各自效果之和时,便产生了统计上的交互作用。例如,单独一个基因变异可能使某性状增加2分,一个环境因素可能独立增加3分,但如果在特定环境下携带该变异,可能使性状增加50分(或减至0分)——这便是一种交互作用。这种交互作用可以从两个角度解释:变异在不同环境中对性状的影响(即变异受环境调节);或者环境对携带者与非携带者性状变化的不同影响(即环境受遗传变异调节)。
大多数常见性状具有高度的多基因性质,因此我们应在许多遗传因素的背景下考虑基因与环境之间的相互作用(GxE)。现有的基因环境交互作用模型主要包括:
基因座特异性(Locus-specific)模型,即不同的个体遗传变异与环境以不同方式相互作用。例如,饮酒可能引发多种生化变化,增强某些遗传变异对BMI的影响,而减弱其他变异的影响。在饮酒者和非饮酒者中,每种变异的效应大小将表现出特异性差异。对于在两种环境中测量的相同性状,这将体现为不完全的遗传相关性。
均匀放大(Uniform amplification)模型,即性状的整个遗传成分在不同环境中的表达不同。设想在一个学校教育质量较低的环境中,视力不佳的孩子可能被忽视或落后。随着时间的推移,这些细微的遗传差异可能会因环境的放大作用而使得教育水平的遗传率提高。而在教育质量较高的学校中,同样视力变异的孩子可能会获得免费的视力检查和眼镜,因此学业表现良好;在这种情况下,环境实际上缓和了遗传对教育成就的影响。由于环境对视力的作用,所有视力变异在两种环境中的影响均表现出相同的差异。这种现象有时被称为“基因-环境交易(gene-environment transaction)”,因为基因和环境的影响在不同情况下交替发生。在两种不同环境中测量的相同性状会表现为完美的遗传相关性,但在遗传率上存在显著差异。
比例放大(Proportional amplification)模型,即遗传因素和环境因素均匀放大。设想遗传因素和环境因素共同影响代谢途径,进而影响BMI,但男性的代谢途径活跃时间相较女性更长。在这种情况下,男性的遗传和环境影响对代谢途径的影响均有所增加。性别在这两种输入中扮演了比例放大器的角色。在两种不同环境中测量的相同性状将表现为完美的遗传相关性,遗传率没有差异,但总体表型变异存在差异(例如,男性的BMI变异更大)。
从下面的模拟图中可以看出:对于基因座特异性GxE,不同环境下的遗传效应大小不同;而对于放大效应,它们的大小都呈类似程度的增加。
一般来说,环境修饰因子与遗传影响的距离越远,其对遗传和环境效应的放大作用越显著,这与比例放大模型相符合。例如,FTO基因的环境修饰因子与遗传相距很近,因此表现出基因座特异性。而像视力这样的高遗传性状,其环境修饰因子在许多变异的上游位置,尽管主要影响遗传途径,也会导致均匀放大效应。相反,对于遗传性较低且途径扩散性较大的特征,如新陈代谢,其环境变化因素位于遗传和环境的上游,从而引起比例放大效应。
多基因遗传效应非常普遍
量化多基因GxE的标准方法是收集多个环境中大量个体的遗传和表型数据,然后将GxE相互作用的方差或遗传率成分加入标准的估算模型中,这些模型通常不会区分不同的模型参数。然而,这种方法的一个明显局限是环境因素需要是已知并且可测量的,这对于那些不包括社会或流行病学调查的临床生物库来说尤为挑战性。
在早期的多基因遗传效应研究中,Robinson等(2017)使用方差分量法估算了体质指数(BMI)与各种生活方式因素的遗传率。他们选择BMI作为研究对象,因为相较于其他性状,他们发现来自双胞胎数据的遗传率估计存在较大的差异,这种差异可能被GxE相互作用所放大。
研究从一个普遍存在的“环境”因素——年龄入手。年龄是一个有趣的生物变量,因为它可以捕捉到多因素的环境影响,包括随时间变化或积累的外部暴露(如心理压力)和内源性生物因素(如DNA修复)。研究发现,BMI的单核苷酸多态性(SNP)与年龄之间存在高度显著的交互作用,在标准加性遗传率的基础上,年龄相关的遗传率增加了8%。这种交互作用与位点特异性模型高度吻合,因为年轻和年老个体之间的遗传相关性很低(rg=0.56,s.e. 0.19),而整体遗传率并未显著变化。这表明遗传变异在整个生命过程中的影响程度虽相同,但其潜在机制却以特异方式发生变化。作为对照,在身高这一性状上没有观察到这种差异,可能是因为年龄改变了许多基本的生物过程的功能。
接着,研究人员对BMI进行了年龄和性别的调整,并评估了8个自我报告生活方式变量的GxE遗传性。包含GxE项的模型在拟合每个环境变量时表现更佳,支持了环境相互作用的普遍假设。特别是在吸烟的情况下,观察到了独立显著的交互作用,这解释了BMI中额外4%的变异。这8个因素的总和可以解释额外的7.5%变异,而边际遗传率为22%。因此,环境交互作用使解释的变异量增加了约1.4倍。
许多性状与环境的交互作用都得到了系统化的统计分析。Di Scipio等(2023)开发了一种快速识别GxE的方法,并将其应用于英国生物库(UK Biobank,简称UKB)数据中。在测试中,他们发现39对性状-环境组合(trait-environment pairs)中有15对显示出显著的GxE遗传率。例如,甘油三酯水平的总遗传率为21%,其与腰臀比的GxE交互遗传率为7%。Pazokitoroudi等(2024)则采用类似方法分析了200个性状-环境对,其中68对表现出显著的GxE遗传性,21个性状与吸烟的交互作用显著,GxE遗传率平均为加性遗传率的6%。尽管单个性状与环境的相互作用通常较小,但这种现象似乎普遍存在。
在多变量环境的研究中,Kerin等(2020)提出了一种多变量模型,该模型能够将多个环境测量值合成为一个线性“环境得分”,类似于多基因风险得分,这种环境得分是所有环境因素的加权总和,旨在最大化GxE效应的体现。应用此方法后,将所得到的环境得分作为单一环境变量来计算多环境GxE遗传率。这种方法已被用于BMI、3个与血压相关的性状,以及42个行为/生活方式环境变量,这些数据均来源于UKB。对于BMI,多变量GxE遗传性解释了性状变异的6%-14%。脉压的GxE遗传性显著,解释了13%的性状变异,相比之下加性遗传解释了23%。有趣的是,这种GxE遗传性主要集中在低频变异中,其程度远超过加性遗传,这表明可能存在非常规的进化动态。总体来看,将多个环境因素聚合为一个复合环境得分,有助于进一步提高单一环境交互作用之外可解释的性状变异比例。
同型婚配(Homogamy)制也构成了一种特殊的环境
同型婚配指的是人们倾向于选择与自己在社会经济地位、教育水平、财富积累、宗教信仰、种族、年龄或其他重要社会属性相似的配偶的现象,中文里的一个词可以很好的描述它——即“门当户对”。这种现象是由多种社会动力和个人选择共同作用的结果,反映了个体在伴侣选择时的倾向性和限制性。
在前文中,我们看到了多种环境影响的例子,但一个常被忽视的环境影响来源是文化结构,尤其是同型婚配的程度和结构。表型同配不仅会增加配偶与兄弟姐妹之间的遗传相似性,还会增强原本不相关遗传变异体之间的相关性,从而提高种群的整体遗传变异。这意味着,进行同型婚配的亚群体相比随机婚配的群体,将展现更高的遗传率。根据上述模型,这可以视作GxE效应的一种放大,尽管这里的“E”仅指婚配模式。除了遗传变异的实际增加外,同型婚配还往往会导致遗传率估计值的增大,从而放大估计值。
参考文献:
[1] Robinson, M. R., English, G., Moser, G., Lloyd-Jones, L. R., Triplett, M. A., Zhu, Z., ... & Visscher, P. M. (2017). Genotype–covariate interaction effects and the heritability of adult body mass index. Nature Genetics, 49(8), 1174-1181.
[2] Pazokitoroudi, A., Liu, Z., Dahl, A., Zaitlen, N., Rosset, S., & Sankararaman, S. (2024). A scalable and robust variance components method reveals insights into the architecture of gene-environment interactions underlying complex traits. The American Journal of Human Genetics.
[3] Di Scipio, M., Khan, M., Mao, S., Chong, M., Judge, C., Pathan, N., ... & Paré, G. (2023). A versatile, fast and unbiased method for estimation of gene-by-environment interaction effects on biobank-scale datasets. Nature Communications,14(1), 5196.
[4] Kerin, M., & Marchini, J. (2020). Inferring gene-by-environment interactions with a Bayesian whole-genome regression model. The American Journal of Human Genetics,107(4), 698-713.