Tian Y, Tirrell M, Davis C, Wesson JA. Protein primary structure correlates with calcium oxalate stone matrix preference. PLoS One. 2021 Sep 23;16(9):e0257515. doi: 10.1371/journal.pone.0257515. PMID: 34555074; PMCID: PMC8459966.
蛋白质一级结构与草酸钙结石基质偏好相关
尽管基质蛋白在草酸钙肾结石形成中具有明显的重要性,但蛋白质混合物的复杂性仍然无法解释。基于一系列实验,我们提出了一个模型,其中由含有强电荷聚阴离子和强电荷聚阳离子的混合物形成的蛋白质聚集体可以引发草酸钙晶体形成和晶体聚集以形成结石。这些蛋白质聚集体还优先从尿液中吸附许多带弱电荷的蛋白质,形成一种复杂的蛋白质混合物,模拟在患者样本中观察到的蛋白质分布。为了验证该模型的基本细节并确定在弱电荷蛋白质中观察到的相选择性的解释,我们检查了主要蛋白质的一级结构,它们的天冬氨酸、谷氨酸、赖氨酸和精氨酸含量偏爱基质相或尿相;在正常尿液 pH 值为 6-7 时代表固定电荷的氨基酸。我们验证了蛋白质石基质中的富集,大量带电残基表现出极端等电点,低 (pI<5) 和高 (pI>9)。我们发现,许多具有中间等电点的蛋白质表现出对结石基质的偏好,但它们的电荷残基数量较少,但总电荷仍比偏爱尿相的中间等电点蛋白质多。虽然尚未考虑其他电荷来源,但蛋白质对结石基质的偏好似乎与高总电荷含量相关。
介绍
草酸钙 (CaOx) 肾结石病是一种日益普遍的疾病 ,但其发病机制仍不清楚 [ 4 , 5 ]。虽然疾病活动与基于小离子化学计算的关于草酸钙晶体形成的尿液过饱和度相关,但在随机选择的患者中,尿液过饱和度是结石形成疾病状态的不良预测指标 [ 5 ]。因此,几十年来的研究都集中在蛋白质的研究上,蛋白质是肾结石中一种很小但普遍存在且必不可少的成分 [ 6 , 7]。最初,这些研究集中在各种单独的蛋白质上,没有发现任何蛋白质和疾病状态之间的一致联系。过去10年的许多研究表明,使用蛋白质组学方法 [8-13] 在 CaOx 结石基质中存在数百种独特的蛋白质,但所涉及的蛋白质数量之多,混淆了确定它们在结石形成中的作用的努力。
我们提出了这样一个假设,即蛋白质聚集体的形成在 CaOx 结石形成的起始中起关键作用 [ 8 , 14 ]。两项体外研究确定了蛋白质聚集体形成与结石形成风险之间的潜在联系。一个表明由强聚阴离子与强聚阳离子混合形成的蛋白质聚集体会诱导 CaOx 晶体聚集 [ 14 ],另一个表明尿调节素(尿液和结石基质中普遍存在的阴离子蛋白质)的自聚集体会诱导 CaOx 晶体聚集体形成 [ 14]。 15]。最近公布的定量蛋白质组学实验数据表明,结石基质中含有许多尿液蛋白质,但这些蛋白质的相对丰度与大多数蛋白质在尿液中的丰度存在显着差异 [ 8 ]。此外,强阴离子蛋白和强阳离子蛋白在石基质中的富集支持了这样一个假设,即这些强离子蛋白的聚集是触发事件,大多数其他蛋白质在基质和尿相之间表现出分配行为 .
含有阴离子侧链,特别是羧酸侧链的蛋白质,基于它们在石头基质中的频繁观察,以及它们在实验室中影响 CaOx 晶体形成的能力的明确证据,被认为是重要的。强阴离子蛋白质在体外对 CaOx 结晶的一般抑制特性似乎与在石基质中经常观察到的这些相同蛋白质的存在相矛盾[ 8-12],但反复观察它们在基质中的存在表明这些蛋白质可能对结石的形成至关重要。在带相反电荷的聚合物(蛋白质)之间的静电引力驱动下,强阳离子蛋白质可能会与强阴离子蛋白质聚集;一种已在合成聚合物中得到广泛研究的过程 [ 19 , 20 ]。其他带电更弱的蛋白质以选择性方式被吸引到这些聚集体上,这种方式模仿了它们对结石基质的选择性,正如在模型系统中观察到的那样,在尿液中发现的正常蛋白质混合物中添加了聚精氨酸 [ 16 ]。迄今为止,尚未描述这种相选择性的物理化学基础。
在这项研究中,我们检查并比较了表现出偏好结石基质的最丰富蛋白质和表现出偏好尿相的最丰富蛋白质中的氨基酸组成。这种比较的目的是确定决定蛋白质对一个阶段相对于另一个阶段的偏好的主要结构特征,以及更全面地探索我们上述假设的细节。我们专门列举了每种蛋白质中的氨基酸残基,这些氨基酸残基代表正常尿液 pH 值为 6-7(天冬氨酸 (D)、谷氨酸 (E)、赖氨酸 (K) 和精氨酸 (R))下的固定电荷,以更好地了解其贡献这种主要结构特征与临床结石样本中观察到的蛋白质分布有关。
材料和方法
蛋白质特性
我们从之前报道的蛋白质组学分析结果中确定了结石基质偏好蛋白 (MPPs) 和尿液偏好蛋白 (UPPs)。基于 8 个 CaOx 一水合物 (COM) 结石基质样品与 25 个结石前尿 (SFU) 样品的平均蛋白质丰度比较 [ 8 ],7 种蛋白质,包括 UROM(尿调节素)、EGF(表皮生长因子)、APOD(载脂蛋白 D)、ALBU(白蛋白)、IGKC(Ig κ 链 C 区)、IGHG1(Ig γ-2 链 C)和 IPSP(血浆丝氨酸蛋白酶抑制剂),来自前 60 种 COM 基质蛋白列表(表 2 在 [参考文献8 ])在 SFU 样品中的相对丰度较高。因此,这 7 种蛋白质被添加到 MPP 列表中未发现的来自 SFU 的 31 种丰富蛋白质(相对丰度 > 0.5%)的列表中[21 ],创建一个UPP列表。因此,前 60 个 COM 基质蛋白列表中剩余的 COM 基质蛋白被识别为 MPP。由于蛋白质数据库的更新,最初鉴定的泛素的详细蛋白质主要信息没有明确定义。因此,剔除泛素后, S1 表中一共列举了 52 个 MPPs 及其氨基酸组成,S2 表中列举了 38 个 UPPs 及其氨基酸组成。
道德声明
本道德声明是为了回应审查中提出的问题而添加的。本分析中使用的所有蛋白质特性和相对丰度数据均来自先前发表的手稿 [参考文献 8 和 21]。
从表 2 和补充数据表 S6 [参考文献21 ]中提取 SFU 样品的蛋白质身份和丰度数据,这些数据按上述分类。本研究招募了患者,并在 Clement J Zablocki IRB#1(研究编号 9305-01P)的监督下获得了书面知情同意书。所有数据在发表前都被去识别化(仅包括性别和年龄)。
从表 2 [参考8 ]中提取了 COM 矩阵偏好的蛋白质特性和丰度,这些数据按上述排序。本研究中的四颗 CaOx 肾结石来自之前在曼德尔国际结石和分子分析中心(MIS.MAC,密尔沃基,威斯康星州,美国)或国家弗吉尼亚州进行鉴定的病理废物标本(年龄和性别除外)。Crystal Identification Center (Milwaukee, WI, USA) 并在未获得 IRB 批准的情况下使用。在威斯康星医学院/Froedtert 医院机构审查委员会的监督下,从新招募的患者中获得了额外的四颗结石,并在取石手术的书面知情同意(协议编号PRO21952),并且这些样本也被取消识别,只包括种族、年龄和性别。
蛋白质氨基酸含量
基于 Uniprot 数据库 ( www.uniprot.org )中的一级结构数据,确定了两组蛋白质中每个完整蛋白质的 D、E、K 和 R 残基的氨基酸含量。每种蛋白质的 D、E、K 和 R 残基数列在S1和S2中表格(分别针对 MPP 和 UPP),以及下面定义的计算值。使用这些数据并为这些氨基酸中的每一个指定一个电荷值 1,每个蛋白质中的总电荷残基很容易计算为 D+E+K+R 的总和,尽管总电荷百分比(总电荷/总残基数 x 100%)提供了更公平的单个蛋白质特性比较(分子量标准化)。每种蛋白质的净电荷也计算为 (K+R)-(D+E),以便为每种蛋白质表示适当的符号(负对正),这些数据也包含在S1和S2表中,以及以类似方式计算的净电荷百分比(净电荷/总残留量 x 100%)。
计算双尾非参数Spearman相关系数,用于MPP的净电荷百分比和净电荷数的相关性分析。双尾 Mann-Whitney 检验用于比较 MPP 和 UPP 组的总电荷百分比。使用 GraphPad Prism 进行统计分析。
结果
这些蛋白质组的主要比较是基于电荷百分比数据进行的,原因有两个。首先,电荷残基的百分比为这些带电蛋白质的平均蛋白质或聚合物特性提供了比总数更真实的测量,因为它标准化了蛋白质之间分子量的巨大差异。其次,虽然任一类别中的大多数蛋白质都落在 25,000 Da 和 100,000 Da 的分子量范围内,但少数具有更高分子量和相应更多带电残基的蛋白质会通过将大多数其他蛋白质压缩成图的狭窄区域。MPP 和 UPP 组之间蛋白质分布的明显差异在总电荷百分比与净电荷百分比的聚类图中很明显,图。1. 显然,与 MPP 相比,UPP 的总充电百分比和净充电百分比的分布更为紧密。正如预期的那样,任何一组中的大多数蛋白质都带负电荷,即使不考虑翻译后修饰(糖基化和磷酸化),这会使这些蛋白质带更多负电荷。此外,表现出极端净电荷百分比值的蛋白质,无论是正电荷还是负电荷,都清楚地表现出较大的总电荷百分比值,尽管在 MPP 组中有一些净电荷百分比几乎为零的蛋白质具有较大的总电荷百分比。我们使用双尾 Spearman 相关分析测试了该关联的统计相关性,如图2在 MPP 的净电荷百分比与净电荷数的关系图中。证实了极端总电荷和极端净电荷之间的强相关系数 r = 0.923 (p<0.0001)。
图。1
总电荷百分比与净电荷百分比的聚类图。
基质偏好蛋白 (MPP) 显示在左侧面板中,尿液偏好蛋白 (UPP) 显示在右侧面板中。在 MPP 组中观察到的具有高总电荷百分比和极端净电荷百分比的蛋白质比在 UPP 组中多得多。
图2 Spearman 相关分析图。
在该图中,将净电荷百分比与 MPP 的净电荷数作图,显示出很强的相关性(r = 0.923;p<0.0001)。
MPP 和 UPP 组之间的净电荷百分比分布的更直接比较显示在集群图中图 3. 该图强调了石基质中同时存在强净正电荷蛋白质和强净负电荷蛋白质。遵循所提出模型的原则,这些具有极端电荷的 MPP 是显而易见的,并且可以在进一步分析中轻松移除,以检查弱电荷 MPP 和类似充电 UPP 之间的差异。通过去除净电荷百分比 > 5% 或净电荷百分比 < - 5% 的蛋白质来截断S1 表中的 MPP 列表,从 MPP 列表中消除 15 种蛋白质(8 个阴离子蛋白质和 7 种阳离子蛋白质)以生成截断的 MPP 表如S3 表所示。未对尿液首选蛋白质列表进行任何调整,尽管 UPP 列表中剩余的 3 种蛋白质少量超出了这些截止值。
图 3
净电荷百分比的聚类图。
MPPs(黑点)和 UPPs(粉红色点)都在这里表示,MPP 分布展示了更多具有极值净电荷百分比(正电荷和负电荷)的蛋白质。
使用截断的 MPP 集,然后在净电荷百分比和总电荷百分比参数之间进行比较,如图所示图 4. 第一和第三数据列显示净电荷百分比分布,而相应的总电荷百分比分布绘制在第二和第四列。净电荷百分比分布无法区分,但弱电荷 MPP 通常包含较大百分比的总电荷。双尾 Mann-Whitney 检验显示,弱电荷(净)MPP(中位数 23%,n = 37 或平均 25±6%)的总电荷百分比比 UPP(中位数 20 %,n = 38 或平均值 20±4%)。请注意,在截短的 MPP 组中,一种蛋白质 HMGB1(高迁移率组蛋白 B1)显示出比大多数其他蛋白质大得多的 49.7% 的总电荷百分比,尽管它仍然表现出 -2.3% 的低净电荷百分比。从该分析中删除 HMGB1 不会影响结果,
图 4
将截断的 MPP 设置与 UPP 进行比较的净电荷百分比和总电荷百分比的集群图。
正如预期的那样,截断的 MPP(黑色圆圈)和 UPP(绿色三角形)的净电荷百分比簇紧密聚集在 0 附近,平均值之间没有观察到差异。MPP 数据(粉红色方块)的总电荷百分比簇显示出更广泛的分布,特别是扩展到更高的总电荷值,其平均值大于 UPP 数据(紫色倒三角形);分别为 25±6% 和 20±4% (p<0.0001)。
讨论
对基质偏好蛋白的氨基酸含量的分析证实了与其他基质蛋白或蛋白质相比,处于等电点分布(pI <5 或 >9)任一极端的蛋白质含有相对较大的电荷基团总数的预期特征更喜欢患者样本中的尿液相。聚电解质理论肯定会预测,这些带相反电荷的蛋白质会通过基于各自净电荷百分比的静电相互作用而最强烈地相互吸引,这在概念上支持了这些具有极高净电荷百分比的蛋白质引发聚集的观点 [ 19 , 20]。一旦这些聚集体形成,它们显然也会创造一个富含任一符号带电残基的微环境。这种聚集体的存在与体外对结晶现象的影响相关,特别是诱导 COM 晶体的聚集 [ 14 , 22 ],与结石的形成一致。不幸的是,迄今为止的实验室实验还没有探索蛋白质-晶体相互作用的改变,这可能是由于在这些混合物中包含了许多更弱电荷的蛋白质,这些蛋白质将代表实际的结石基质,也没有考虑到蛋白质的改变——可能支持蛋白质聚集体稳定性的蛋白质相互作用。
最大数量的 MPP 与 UPP 具有相似的特征,因为它们的净电荷百分比接近于零,并且它们总体上比具有极端等电点的蛋白质带电更弱。该分析的一个重要新发现在通过去除具有极端等电点的蛋白质和尿液偏好蛋白质制成的截短组 MPP 之间的总电荷百分比的比较中阐明。在此比较中,MPP 中的总电荷含量仍高于在 UPP 中观察到的电荷含量,具有高度确定性。这一发现意味着离子相互作用而不是其他疏水相互作用是指导弱电荷蛋白质对基质相的相选择性的最重要特征。此外,[ 16 ] 模拟了在患者 COM 结石基质样品中观察到的分布 [ 8 ] 表明这种蛋白质选择性是蛋白质-蛋白质相互作用而不是蛋白质-晶体相互作用的结果。接近零净电荷基质偏好蛋白质的较大总电荷含量也直观地令人满意,因为它们与具有更极端等电点的蛋白质表现出的总电荷值更大的相似性,这些蛋白质被认为会触发聚集体形成。
这种分析受到几个因素的限制。首先,与所有蛋白质分布的质谱研究一样,完整蛋白质的存在是从对这些蛋白质的选定片段的观察中推断出来的,尽管有限的凝胶电泳数据支持完整蛋白质的存在 [ 14 , 23 ]。其次,很少有关于结石病和尿液的蛋白质组学研究旨在报告观察到的所有蛋白质的特性和相对丰度。大多数研究都集中在更典型的“标记”蛋白质搜索上。虽然在基质和尿液中鉴定出的蛋白质列表在很大程度上是重叠的,但本研究中的分析只能应用于其中一些研究 [ 8 , 9]。第三,无论是结石形成者还是健康成人,患者蛋白质分布随时间的变化水平都没有得到很好的表征。更具体地说,没有关于结石形成者活跃结石生长期间尿液蛋白质组学的数据,尽管在检查随机样本时似乎不太可能错过足够大的变化来解释结石基质和尿液蛋白质分布之间的差异迄今为止报告的数十名造石者。第四,未考虑其他来源的电荷贡献,例如糖基化和磷酸化。一般来说,这些蛋白质修饰会给蛋白质增加负电荷并增加总电荷百分比。在基质和尿液中发现的许多蛋白质是糖蛋白并具有磷酸化位点,但是糖基化水平很难通过质谱法在复杂混合物中测量整个蛋白质分布,例如这些。磷酸化水平更容易获得,但这些测量需要对质谱数据集进行完整的重新分析,这超出了本研究的范围。探索更复杂的蛋白质混合物对结晶现象的影响的实验在此阶段似乎更重要,以更全面地表征结石形成。
结论
总之,对显示对 COM 结石基质的选择性偏好的蛋白质中 D、E、K 和 R 的氨基酸含量的检查揭示了支持我们提出的结石形成机制的 3 组蛋白质。前两组蛋白质的特点是净电荷百分比大(一个带负电,另一个带正电)和总电荷百分比大,这些蛋白质可能在非常低的浓度下聚集,可能引发结石形成。第三组包含许多单独的蛋白质,其净电荷百分比接近零,总电荷百分比略低。与在患者样品中显示偏好尿相的蛋白质相比,偏好基质的蛋白质表现出相似的净电荷百分比分布,但总电荷百分比明显高于尿液偏好蛋白质,这表明对结石基质的偏好与高总电荷残留物含量有关。这些更复杂的蛋白质混合物在结晶测定中的行为值得进一步关注。