Nature Methods|使用Kubernetes扩展基于深度学习的细胞图像分析

文摘   2024-10-24 15:20   天津  

关注+标星,邂逅每一篇经典!

投稿或寻求报道:qunfunction@163.com


|太长不看版

深度学习正在改变生物图像的分析方式,但将这些模型应用于大规模数据集仍然具有挑战性。

在这里,作者介绍了DeepCell Kiosk,这是一种云原生软件,能够动态扩展深度学习工作流程以适应大规模成像数据集。

为了展示该软件的可扩展性和经济性,作者在大约5.5小时内识别了106张100万像素图像中的细胞核,成本约为250美元,根据集群配置的不同,成本可以降至100美元以下。

学术地址:

https://www.nature.com/articles/s41592-020-01023-0

代码地址:

 https://github.com/vanvalenlab

|匠心独运

图1:DeepCell Kiosk的架构和性能。a,数据在DeepCell Kiosk中的流动。提交到运行中的Kiosk集群的图像会被放入队列中。一旦进入队列,这些图像将由称为消费者的对象处理,消费者执行给定管道中的所有计算操作。消费者自己执行大部分计算,但通过向TensorFlow Serving提交数据并捕获结果来访问深度学习。这种分离允许传统操作和深度学习操作发生在不同类型节点上,这对于高效的资源分配至关重要。处理完成后,结果返回队列,用户可以下载。b,左,基准测试展示了推理速度扩展到大规模成像数据集的能力(详情见补充信息)。吞吐量最终受限于数据传输速度。右,成本分析显示了经济性。网络成本是由多区域集群中的跨区域网络流量产生的,这类集群比单区域集群更稳定且扩展更快。当用户配置单区域集群时,可以避免这种成本。对于100万张图像的运行进行了一次基准测试,其他情况下进行了三次重复测试。误差条代表重复测量的标准差。c,DeepCell Kiosk能够构建和扩展多模型管道。例如,活细胞成像消费者可以访问用于分割和跟踪的深度学习模型。活细胞成像消费者将电影帧放入分割消费者的队列中,并在那里并行处理。分割完成后,图像由跟踪消费者处理,以随时间链接细胞并构建谱系。结果包括分割和跟踪细胞的标签图像以及描述母女关系的JSON文件,这些结果被上传到云存储桶,用户可以从那里下载。

关注+标星,邂逅每一篇经典!

群函数
分享前沿的开源技术以及有趣的科普知识。敬请关注!
 最新文章