基因库样本在精神PRS和重合位点检出率上表现均偏低于临床样本。同时在症状重度、教育水平、认知功能、就业状况等多方面也表现出相对较轻的特征。由于自然选择的影响,临床表型特征表现出较轻的特征。
大规模志愿参与式人口基因库资源快速增加,但参与者群体受众选性影响,如UK基因库参与者较年轻、女性多、社会经济地位高。众选导致原有疾病比例估计失真,但对食物暴露-疾病关系研究影响较小。同时会影响基因关联分析效应等下游研究。性质不明确的自报记录法和电子病历系统也会影响精神疾病定义。临床样本也有失真,如难以就医者低代表性。症状轻微和疗效好者也难入选。UK基因库精神疾病样本特征不明,与PGC和临床样本相比是否存在差异?
总体来说,人口基因库通过非随机参与引入特定偏差,可能影响精神疾病特征和研究结果。本研究将比较UK基因库精神疾病样本与其他来源之间在基因、复合位点和临床表型上的差异,为后续研究提供借鉴。
UK Biobank包含约50万英国40-69岁成年人。研究提取了UK Biobank进行精神和行为障碍筛查时标记为精神分裂症的1438名参与者作为例组,剩余没有精神分裂症记录的参与者作为对照组。
本研究包含4个来源的临床样本: CLOZUK样本,约1.4万人服用口氯氮平治疗旁路精神分裂症。CardiffCOGS样本767人,Cardiff F-Series样本648人,Cardiff双胞胎样本381人,这三个样本均来自威尔士卡迪夫的社区和门诊。
分析方法上,对UK Biobank和PGC精神分裂症GWAS结果进行遗传相关性分析。UK Biobank和临床样本间PRS值和CNV频率比较。UK Biobank例组与临床样本间与精神分裂症相关的人口特征、认知能力、精神和生理疾病情况进行对比。
统计分析考虑UK Biobank和临床样本的复杂采样设计,主要统计方法包括 logistic回归、PRS分析等。所有P值设为0.05进行二分假设检验。由于临床样本之间的样本量差异很大,组间比较采用有控制变量的pairwise方法,同时进行Bonferroni校正控制多重比较。研究考察的因素包括人口特征、PRS值、CNV频率以及临床表现等多个方面,目的在于深入分析样本间差异。
研究首先对比基因组联关分析结果,基因库精神疾病组数据与PGC精神GWAS结果高度一致,遗传相关系数近1,表明基因风险模式保留完整。此外,基于PGC数据构建的精神PRS也能有效预测基因库样本的危险程度,表现水平超过其他76个样本的一半。
图1:遗传相关性
研究还利用了多种临床特征和PRS工具对精神疾病基因库样本与4个临床精神样本进行深入对比。结果显示,基因库样本在精神PRS和重合位点检出率上表现均偏低于临床样本。同时在症状重度、教育水平、认知功能、就业状况等多方面也表现出相对较轻的特征。
图2:队列之间多基因风险比较
此外,相比正常对照组,基因库精神样本在性别比例、育儿状况、教育水平、认知水平以及多种慢性病风险等方面也存在显著差异。
图3:队列之间表型比较
综上所述,研究采用多种分析工具从多个维度对比表明,虽基因库样本在遗传机制上与临床样本保持一致,但由于自然选择的影响,临床表型特征表现出较轻的特征,体现了一定的选择性偏差。
原始出处:
Legge SE, Pardiñas AF, Woolway G, et al. Genetic and Phenotypic Features of Schizophrenia in the UK Biobank. JAMA Psychiatry. Published online March 27, 2024. doi:10.1001/jamapsychiatry.2024.0200
注意!这10个常见焦虑症状不可忽视,你的胃可能在诉说......