DRUGAI
今天为大家介绍的是来自美国Broad研究所中Anne E. Carpenter团队的一篇论文。现代定量图像分析技术已经使高通量、高内涵成像实验成为可能。与传统高内涵筛选中仅测量少数特征不同,基于图像的分析方法充分利用图像中丰富的信息,以识别生物样本之间的相似性或差异。在此,作者回顾了自2013年引入以来,为优化与标准化基于图像的分析而设计的显微镜细胞标记方法——Cell Painting在过去十年中的进展与应用。Cell Painting通过改进实验流程、针对不同干扰因素的适配,以及在特征提取、质量控制和批次效应校正方面的方法增强,不断提升了其对细胞在各种扰动下所作出反应的捕捉能力。作为一项多功能工具,Cell Painting已广泛应用于多种研究领域,无论是单独使用还是与其他组学数据结合,都可以用于解析化合物的作用机制、毒性特征以及其他生物学效应。展望未来,进一步的进步可能包括采用新的计算和实验技术、利用更多可公开获得的数据集,并与其他高内涵数据类型整合,从而推动这一领域的持续发展。
表型药物发现(PDD)指在生物系统中寻找能够改变特定疾病表型的化合物。这一策略从最初在动物模型中检测少量化合物,发展到如今在细胞模型中筛选数百万种化合物。与之相对,靶点导向药物发现(TDD)侧重于寻找与预先确定的靶标相互作用的化合物。尽管这两种方法均已产出多个治疗药物,但越来越多的证据表明,PDD比TDD更有可能发现首创类药物。高内涵筛选(HCS)是一种高效的表型筛选策略,它使用显微成像作为检测读出手段。HCS通过图像来捕捉并量化细胞表型,可用于鉴定候选靶标(例如对基因干扰的筛选)和治疗药物(例如对小分子化合物的筛选)。HCS的核心是细胞形态学——即细胞的视觉外观(通常利用针对细胞结构或生物标志物的染色进行标记),这与细胞的生理状态、健康状况和功能密切相关。随着转录组分析和自动化样品制备及显微技术等方面的进步,图像基因型分析以及最大化信息量的图像检测方法逐渐成为主流。
图 1
最受欢迎的图像基因型分析方法之一是Cell Painting技术,该技术通过多种荧光染料对细胞进行“着色”,在对主要细胞器或成分染色的过程中捕捉细胞的表型状态及对扰动的响应(图1a)。Cell Painting检测方案设计简便、成本低廉,不需要定制设备,只需合适的显微滤光片即可,并且依赖染料而非抗体。多重染色完成后,采用自动化成像分析流程对图像进行处理,提取形态学特征谱,并相对于参考和对照化合物进行标准化(图1b)。这种方法为每个细胞生成包括上千个形态学特征(如大小、形状、纹理和强度)在内的高维数据集,通过对形态学特征谱进行各种归一化和批次效应校正,最终用于下游分析(图1c)。
在此,作者旨在以相对系统性的审阅形式(而非涵盖整个图像基因型分析领域)全面探讨Cell Painting在过去十年(2013–2023)中在药物发现及相关领域的进展与影响。作者将探讨方法学的改进如何提升该检测方案的稳健性,并讨论Cell Painting如何加深我们对疾病进程的理解和促进新疗法的开发。特别是,作者将阐述Cell Painting与机器学习及其他组学数据整合的情况,探讨其在预测毒理学方面的作用以及提高药物安全性和有效性的意义。总体而言,作者将全面呈现Cell Painting在药物发现中的影响与潜力。
系统性分析Cell Painting文献
作者通过在PubMed、Scopus和ScienceDirect(截至2023年6月)使用关键词“Cell Painting”检索了340篇相关文章。筛选条件包括:2012年后发表的英文同行评审文章(关键预印本除外)。排除重复文献(207篇)和综述文章(41篇)后,剩余92篇文章进行了全文分析。进一步筛选后,排除了21篇不相关或不符合条件的研究,并通过手动搜索补充了19篇相关研究(包括2023年6月后发表的部分文章),最终纳入90篇研究进行综述。这一过程如系统评价和荟萃分析的首选报告项目流程图(图2a)所示。
图 2
作者从Cell Painting相关的研究中提取了作者、发表年份、关键词和期刊名称等数据,并手动分类了研究问题和主要成果。数据显示,Cell Painting的应用逐年增加,尤其是在2021年至2023年间的研究最多(图2b)。《SLAS Discovery》(实验室自动化与筛选学会期刊)是最受欢迎的发表期刊(图2c),这反映了该检测方法在药物发现和筛选领域的广泛认可。其他主要发表期刊包括计算化学、生物化学和毒理学相关的期刊。
Cell Painting的进展
Cell Painting技术由Gustafsdottir等人于2013年在Broad研究所首次开发,旨在通过六种染料在五个通道中标记八种细胞组分或细胞器,以低成本、高通量地捕捉多种生物相关的表型变化。自首次发布以来,Cell Painting技术经过多次优化与升级,2016年Bray等人发布了稍作调整的v2版本,随后在2022年,JUMP-CP联盟进一步优化了成本和重复性,推出了v3版本。此外,研究者们还对细胞培养时间和图像获取条件进行了优化,以提升检测的准确性和一致性。整体而言,Cell Painting技术在细胞系的选择、检测方案的适应与扩展(图1d, e)、显微成像参数的优化、形态学特征的提取与深度学习应用以及数据标准化与批次效应校正做出了改进。Cell Painting已成为解析细胞表型和机制的重要工具,为科学研究和药物开发提供了强有力的支持。
公开可用的数据集
表 1
Cell Painting已被用于在众多公开可用的数据集中分析化学化合物和基因扰动库。Cell Painting Gallery提供了这些数据集的集中存放位置。目前,针对化合物和/或基因扰动,已有四个大型公开数据集(每个数据集包含数万个扰动,见表1)。
图 3
图3a展示了在本综述中所分析的90项研究中使用的数据集分布情况。为探索JUMP-CP数据集,已经开发了多个可视化工具,包括Broad Institute(broad.io/jump-explore)、Ardigen(ai.ardigen.com/jump-cp-consorcium)、Spring Discovery(www.springscience.com/jump-cp)以及Max Planck分子生理学研究所(cpcse.pythonanywhere.com)。
Cell Painting数据的应用
细胞绘制数据的处理和下游分析(图1c),通常使用机器学习和统计方法,使识别复杂的模式和对许多目标的准确预测成为可能。
预测行为机制
Cell Painting数据通过机器学习和统计方法的处理与下游分析,能够识别复杂模式并准确预测化合物的活性、安全性和毒性,以及其作用机制(MoA)和靶点。监督学习在有标签数据集下训练模型,预测特定结果;无监督学习则用于探索样本间的相似性,进行基因或化合物分组。Cell Painting提供了细胞对化合物扰动的无偏视图,通过与已知MoA的标志性化合物比较,识别新化合物的作用机制。然而,MoA预测复杂,因化合物可能具有多重靶点,不同细胞系的遗传背景也影响结果。
图 4
如图4所示,深度学习模型如卷积神经网络(CNN)显著提升了MoA分类准确性,减少了特征工程的偏差。此外,Cell Painting还用于解析“暗化学物质”(DCM)和识别具有毒性效应的“麻烦”化合物,促进药物发现和安全性评估。
Cell Painting在实验活性预测中的应用
Cell Painting通过图像数据结合机器学习有效预测化合物的生物活性和治疗潜力。2018年,Simm等人利用三通道高通量检测预测了535个检测中的31个,该优异表现引发了对Cell Painting在活性预测中的广泛兴趣。随后,Hofmarcher等人使用公开的Cell Painting和ChEMBL数据,通过卷积神经网络(CNN)在209个生物检测中实现了0.73的平均AUC-ROC值,优于传统数值特征方法。Nyffeler等人比较了多浓度和单浓度策略,发现82%的化学物质预测结果高度一致。将Cell Painting与化学结构信息结合,如BMF Macau模型,显著提高了预测准确性。最新的CLOOME算法整合化学结构和Cell Painting图像,进一步提升了化合物活性预测能力。多项研究确认,结合图像数据与化学结构信息能显著增强预测性能。
Cell Painting在化学指导中的表型分析应用
Cell Painting通过表型分析评估和表征合成化合物,帮助确定结构-活性关系(SAR)。Gerry等人首次利用Cell Painting快速注释化合物的生物效应,促进了药物化学的发展。Nelson等研究发现,不同sp3-rich化合物在Cell Painting中的表型变化受立体化学和附加基团多样性的影响,提升了生物多样性识别能力。此外,研究假自然产物类如PFP,通过Cell Painting识别其与参考化合物的相似性,解析了其作用机制(MoA)。在毒性预测方面,Cell Painting结合化学结构信息显著提高了预测准确性,深度学习模型进一步增强了预测能力。整体而言,Cell Painting不仅加速了新化合物的生物活性评估和MoA解析,还为药物发现和疾病研究提供了强有力的工具,促进了高效的药物开发和安全性评估。
Cell Painting前十年的经验总结
在过去十年中,Cell Painting检测成为药物发现和细胞生物学中广泛使用的工具,全球超过36个学术实验室和筛选中心及51家公司采用,其中13家公司提供该检测服务,输出包括图像、特征谱和样本匹配(图3b)。目前,已有四种通过Cell Painting发现的候选药物进入第二阶段临床试验。Cell Painting利用显微镜的多通道,降低成本和简化步骤,适合高通量筛选和学术实验室小规模测试,表现出极高的稳健性。其主要应用包括揭示化合物作用机制、识别疾病相关表型和预测毒性结果,并在预测器官毒性方面展现出潜力,OASIS联盟也正在积极探索。Cell Painting通过不断优化染色方案、细胞系多样性和数据分析算法,保持了速度、成本效益和信息丰富性的平衡,且具备自动化潜力,成为制药行业的重要工具,进一步推动了药物开发和疾病机制研究。
挑战与未来方向
当前,Cell Painting在图像基因型分析中面临多重挑战。首先,跨模式匹配(如化合物与基因扰动)仍然困难,需改进方法以识别具有相同细胞影响的化合物。其次,形态学特征的解读复杂,即使使用先进的图像分析和机器学习方法,解释结果仍具挑战性。BioMorph空间尝试通过将Cell Painting特征与描述性术语关联,但仍需更多检测数据的映射。此外,数据处理和存储需求巨大,高内容检测产生的数据量庞大,需依赖云解决方案和开源工具以提升管理和共享效率。
未来,Cell Painting有望扩展到三维细胞培养、类器官、组织切片和活细胞成像。同时,深度学习方法的进步,特别是在批次效应校正方面,将显著提升数据分析能力。大型数据集的可用性和联合体的合作将促进新发现,增强学术和产业的兴趣,使Cell Painting在药物发现和生物学研究中的应用前景更加光明。
编译 | 于洲
审稿 | 王梓旭
参考资料
Seal, S., Trapotsi, MA., Spjuth, O. et al. Cell Painting: a decade of discovery and innovation in cellular imaging. Nat Methods (2024). https://doi.org/10.1038/s41592-024-02528-8