北京工业大学大学孙国辉团队–从分子描述符到农药/兽药/生物农药对斑马鱼胚胎的发育毒性预测:用双重计算毒理学方法进行毒性优先排序

文摘   2024-07-08 09:53   英国  

第一作者:王雨桐
通讯作者:孙国辉
通讯单位:北京工业大学化学与生命科学学院 环境与病毒肿瘤学北京市重点实验室
论文DOI: 10.1016/j.jhazmat.2024.134945
图文摘要

                   

成果简介

近日,北京工业大学化学与生命科学学院&环境与病毒肿瘤学北京市重点实验室孙国辉研究团队联合解放军总医院第一医学中心王鹏博士在环境领域著名学术期刊Journal of Hazardous Materials上发表了题为“From molecular descriptors to the developmental toxicity prediction of pesticides/veterinary drugs/bio-pesticides against zebrafish embryo: Dual computational toxicological approaches for prioritization”的研究论文。该工作是孙国辉研究团队关于药物分子及相关化学品毒性预测的实例成果之一。这项研究基于经合组织(OECD)指南,利用定量构效关系(QSAR)和基于交叉参照(RA)的q-RASAR方法构建了农药和兽药对斑马鱼胚胎发育毒性的预测模型,揭示了分子结构信息与发育毒性的机制关系,利用所构建的双重模型对农药和兽药数据库中未经测试的化学品进行了毒性预测和优先级排序。本工作为发育毒性测试提供了有效的替代工具,可用于对未经测试的相关药物分子及化学品进行大规模的生态毒性风险评估。


全文速览

随着全球人口的不断增长,对食品的需求也相应增加。因此,农业和畜牧业仍然是重要的生计来源。为了提高生产力并应对不断增长的粮食需求,农药和兽药在农业和畜牧业中的使用已变得普遍。随着农药/兽药不断进入环境,有必要迅速评估其对生态系统和人类健康的潜在风险。此外,为了严格规范相关药物分子的生产和使用,也有必要进行全面的生态毒理学评价。实验毒性测定通常存在实验周期长、成本高、伦理争议等诸多局限性。此外,它不符合欧盟REACH法规中概述的动物实验“3R原则”。因此,我们迫切需要一种有效且经济的替代方法来评估这些化学物质的生态毒性。许多组织和政府监管机构提倡使用计算毒理学方法来减少对动物试验的依赖,如经合组织(OECD)、美国环保署(US EPA),美国食品和药物管理局(US FDA)、欧洲食品安全局(EFSA)、欧洲化学品管理局(ECHA)、澳大利亚环境署(AEA)和瑞典制药工业协会等。定量构效关系(Quantitative structure-activity relationship, QSAR)作为一种计算毒理学方法,可以有效减少时间和经济成本,最大限度地减少动物实验的必要性,并弥补数据缺口。为了确保QSAR的采用符合科学规范和标准,OECD制定了指导文件,概述了监管应用中QSAR建模的五个关键原则。

目前,农药或兽药的QSAR毒性预测已报道于多种物种,包括藻类、啮齿动物、鸟类、鱼类等。然而,发育毒性预测的报道较少,对未经测试的农药、兽药和生物农药的大规模预测更是少见。此外,分子结构信息与发育毒性之间的机制联系仍有待解决。国际标准化组织(ISO)和OECD等将斑马鱼作为环境毒理学研究的重要模型之一,因为它具有透明的特性,体积小,繁殖能力高。在环境毒理学、医学和制药领域,斑马鱼胚胎发育毒性为评估形态改变、器官形成、生殖问题和过早疾病提供了一种有效的替代方法。

在这项工作中,我们准备了由133种农药和兽药组成的综合毒性数据集,利用遗传算法-多元线性回归(GA-MLR)策略从两个大型二维描述符池中进行变量特征选择,构建QSAR模型。使用最先进的统计标准对内部模型稳健性、拟合优度和外部预测能力进行了评估。特别是,我们使用了交叉参照(RA)技术来弥补小数据集的潜在缺点。为了进一步提高模型的预测性能,我们采用一种新的化学计量学技术称为定量交叉参照结构活性关系(q-RASAR),它同时结合了RA和QSAR的特性,来建立一个更有潜力的q-RASAR模型。利用QSAR、RA和q-RASAR方法,我们探究了结构信息与斑马鱼胚胎发育毒性的机制关系。更重要的是,我们首次利用已建立的QSAR和q-RASAR模型,对农药特性数据库(PPDB)、兽药数据库(VSDB)和生物农药数据库(BPDB)中未测试的化合物进行了全面的发育毒性预测。同时,对这些未测试的农药、兽药和生物农药进行了毒性优先级排序,为相关药物分子和化学品的环境风险评估和监管决策提供了重要信息。

图文导读

 

图1. 训练集(红色)/测试集(蓝色)/真实外部集的化学空间分布

为了确保模型能够预测更广泛的化合物,用于构建模型的数据集应该实现化合物的多样性。以化合物的分子量(MW)和AlogP值作为空间分布参数,可以直观地显示数据集的化学空间分布。图1描述了最优QSAR模型的组成,该模型由101个训练化合物、32个测试化合物和1829个真正的外部化合物(包括1320种农药、297种兽药和212种生物农药)组成。值得注意的是,所有训练集/测试集/真实外部化合物都呈现出相似的空间分布。这种相似性表明建模数据集中存在不同的化学空间,表明所建立的模型具有广泛适用性的潜力。

 

图2. 与最佳QSAR模型相关的各种分析:(A) 2000次Y-随机化测试结果;(B)实验与预测pAC50值的线性相关图;(C) Williams图, 上下虚线表示±3个标准化残差的边界,右侧实线表示结构异常化合物对应的杠杆阈值h*;(D) 6个描述符的相关图;(E)变量重要性图;(F)描述符加载图。


根据外部统计参数,从ORes划分策略中得到最佳QSAR模型,如Eq.(1)所示: pAC50 = 0.825 – 0.3896 × meanI – 0.8779 × GATS3s + 0.0106 × P_VSA_i_1+ 0.6271 × Eig10AEA(dm) + 0.3136 × B10[C-O] - 0⋅8264 × Neoplastic-50 (1);根据OECD原则4,进行了严格的内部和外部验证测试,以评估模型的性能。主要参数: Ntr = 101, Ntest = 32, R2 = 0.7311, Q2LOO = 0.6939, R2test = 0.7502, Q2F1 = 0.7424, Q2F2 = 0.7417, Q2F3 = 0.8095, R2m(test) = 0.6863,Δr2m(test) = 0.0035, CCCtest = 0.8644, RMSEtest = 0.3811, MAEtest = 0.3199。显然,R2和Q2LOO值分别超过了0.6和0.5的阈值。此外,外部相关系数(Q2F1、Q2F2、Q2F3和CCCtest)均落在可接受的范围内,表明其具有较强的外部预测性。此外,由图2A可知,Q2Yscr(−0.0920)和R2Yscr(0.0591)均远小于原模型的Q2LOO(0.6939)和R2(0.7311),表明建立的QSAR模型是一个可靠的预测模型,不存在任何偶然相关。从图2B可以看出,训练集和测试集的预测值与实验值的相关性较好,说明模型具有很好的拟合优度和预测能力。图2C描绘了使用h值和标准化残差构建的Williams图,大多数化合物都在模型的AD范围内,表明该模型在预测未经测试的化合物对斑马鱼胚胎的发育毒性方面具有广泛的实用性。

 

图3. 与最佳q-RASAR模型相关的各种分析:(A) 2000次Y-随机化测试结果;(B)实验与预测pAC50值的线性相关图;(C) Williams图, 上下虚线表示±3个标准化残差的边界,右侧实线表示结构异常化合物对应的杠杆阈值h*;(D) 4个描述符的相关图;(E)变量重要性图;(F)描述符加载图。

根据外部统计参数,从ORes划分策略中得到最佳q-RASAR模型,如Eq.(2)所示: pAC50 = 0.7325 × RA_function(ED) + 0.3867 × Eig10_AEA(dm) – 0.1540 × minHBint4 + 1.5592 × AATSC0p – 0.7831 (2)。我们还进行了严格的内部和外部验证测试,以评估q-RASAR模型的性能。主要参数: R2 = 0.6672, Q2LOO = 0.6359, R2test = 0.7736, Q2F1 = 0.7716, Q2F2 = 0.7710, Q2F3 = 0.8311, CCCtest = 0.8771, RMSEtest = 0.3589, MAEtest = 0.3016。很明显,q-RASAR模型的统计学参数符合当前标准。与QSAR模型相比,q-RASAR模型显示出更好的外部验证指标,表明外部预测性可能更优。图3A描述了Y-随机化分析,其中Q2Yscr(- 0.0760)和R2Yscr(0.0410)与原始Q2(0.6359)和R2(0.6672)显著偏离,表明q-RASAR模型没有任何偶然相关性。图3B表明训练集和测试集中化合物的实验值和预测值之间高度相关。此外,还提供了q-RASAR 模型的应用域图(图3C)来识别异常值。

 

图4.(A) QSAR和(B) q-RASAR模型中与斑马鱼胚胎发育毒性程正相关和负相关的描述符图解

根据OECD原则5,“如果可能的话,QSAR应与机制解释相关联”。最佳QSAR模型包含6个二维分子描述符,包括meanI、GATS3s, P_VSA_i_1, Eig10AEA(dm), B10[C-O]和Neoplastic-50。q-RASAR模型由四个描述符组成,包括一个RASAR描述符(RA_function(ED))和三个2D描述符(Eig10_AEA(dm)、minHBint4和AATSC0p)。两种模型中所选描述符的相关矩阵热图显示,不同变量之间的相关性较低(图2D和图3D),表明描述符对模型的贡献是特异性的,增强了预测的可靠性和鲁棒性。图4所示为通过代表性化合物来说明描述符如何影响斑马鱼胚胎发育毒性。

 

图5. 建立的(A, C, E) QSAR模型和(B, D, F) q-RASAR模型对未检测农药(A和B)、兽药(C和D)和生物农药(E和F)的Insubria分布图.

从PPDB(1320种农药)、VSDB(297种兽药)和BPDB(212种生物农药)三个数据库中共检索到1829个真实外部化合物。同时采用所建立的QSAR和q-RASAR模型对这些真实外部化合物的毒性进行预测,并对模型的预测可靠性和覆盖范围进行了评价。如图5所示,QSAR和q-RASAR模型对未知外源化合物具有很高的预测覆盖率,QSAR模型预测农药、兽药和生物农药的覆盖率分别为93.3%、94.6%和84.9%;q-RASAR模型预测农药、兽药和生物农药的覆盖率分别为91.8%、91.2%和90.1%。鉴于两种模型均具有相当的准确性和可靠性,我们利用两种模型的预测值来预测真实外部化合物对斑马鱼胚胎的发育毒性(如图6所示)。对于在两个模型的ADs范围内的化合物,其预测毒性被确定为两个模型预测结果的平均值。如果一个化合物只在一个模型的AD范围内,则该特定模型的预测结果被认为是最终的。然而,对于位于两个模型的ADs之外的化合物,其预测结果不可靠。

 

图6. 在QSAR和q-RASAR模型中,真实外部化合物杠杆值的重叠情况:(A)农药;(B)兽药;(C)生物农药;其中洋红色区域表示在两种模型ADs范围内的化合物,预测毒性是两种模型预测结果的平均值;黄色区域表示该化合物仅位于一个模型的AD内,该特定模型的预测结果被认为是最终的;白色区域表示位于两个模型的ADs之外的化合物,任何一个模型的预测结果都被忽略.
小结

本研究旨在建立基于回归的化学计量学模型,用于预测在暴露于各种农药和兽药时斑马鱼胚胎的发育毒性。为了实现这一目标,我们利用可用的毒性数据构建了易于理解、可重复和可转移的QSAR和q-RASAR模型,并对其进行了严格的统计验证。我们的研究结果表明,两种模型都具有良好的拟合度、稳健性和预测性。此外,通过结合RA描述符和二维描述符构建的q-RASAR模型进一步提高了外部预测能力。两种模型遵循了OECD制定的严格原则。机制分析阐明了所选描述符与斑马鱼胚胎发育毒性之间的关系。其中,偶极矩、含有C-O片段且距离为10的拓扑结构、分子大小、脂溶性和基于欧氏距离(ED)的RA函数是主要的毒性控制因素。此外,本研究最重要的贡献是为许多未进行测试的药物分子及相关化学品提供了毒性预测。鉴于PPDB、VSDB和BPDB数据库中缺乏大量发育毒性数据,我们利用所建立的QSAR和q-RASAR模型预测数千种未进行测试的农药、兽药和生物农药的发育毒性,研究结果对于制定农药和兽药的安全使用策略具有重要意义。总的来说,我们的模型提供了有效的替代性工具用于发育毒性测试,可用于大规模评估未进行测试的相关药物分子及化学品的生态毒性风险。

上述研究工作得到了国家自然科学基金、北京市自然科学基金及北京市属高校优秀青年人才等项目资助。

主要 作者介绍

 

孙国辉(通讯作者),北京工业大学化学与生命科学学院副院长,副教授,博士生导师。担任SCI期刊Frontiers in Bioscience-Landmark、World Journal of Clinical Oncology和Molecular and Clinical Oncology编委,担任中文核心期刊《化学试剂》青年编委。以第一或通讯作者在Journal of Hazardous Materials、Green Chemistry、Archive of Toxicology、Science of the Total Environment和Biochemical Pharmacology等杂志发表SCI论文38篇,H因子19。主持国家自然科学基金、北京市自然科学基金、北京市教委科研计划和中国博士后基金等项目,入选北京市属高校优秀青年人才计划。长期从事分子毒理学与应用药理学方面的基础与技术应用研究。
通讯邮箱:sunguohui@bjut.edu.cn



JHM家族期刊包括Journal of Hazardous Materials (JHM),Journal of Hazardous Materials Letters (JHM Letters), 和Journal of Hazardous Materials Advances (JHMA)。三本期刊拥有相同的scope,侧重在环境危险物质的迁移,影响,检测,和去除。旗舰期刊JHM发表高水平科研和综述文章,JHM Letters完全开完获取,发表Letter-type科研和前沿综述文章(3000字限制,4副图/表),JHMA定位为中档开放获取期刊。

JHM Family
分享JHM期刊发表的最新文章,为您提供一个分享原创研究成果的平台。
 最新文章