关注+标星,邂逅每一篇经典!
投稿或寻求报道:qunfunction@163.com
|太长不看版
深度学习正在改变生物图像的分析方式,但将这些模型应用于大规模数据集仍然具有挑战性。
在这里,作者介绍了DeepCell Kiosk,这是一种云原生软件,能够动态扩展深度学习工作流程以适应大规模成像数据集。
为了展示该软件的可扩展性和经济性,作者在大约5.5小时内识别了106张100万像素图像中的细胞核,成本约为250美元,根据集群配置的不同,成本可以降至100美元以下。
学术地址:
https://www.nature.com/articles/s41592-020-01023-0
代码地址:
https://github.com/vanvalenlab
|匠心独运
图1:DeepCell Kiosk的架构和性能。a,数据在DeepCell Kiosk中的流动。提交到运行中的Kiosk集群的图像会被放入队列中。一旦进入队列,这些图像将由称为消费者的对象处理,消费者执行给定管道中的所有计算操作。消费者自己执行大部分计算,但通过向TensorFlow Serving提交数据并捕获结果来访问深度学习。这种分离允许传统操作和深度学习操作发生在不同类型节点上,这对于高效的资源分配至关重要。处理完成后,结果返回队列,用户可以下载。b,左,基准测试展示了推理速度扩展到大规模成像数据集的能力(详情见补充信息)。吞吐量最终受限于数据传输速度。右,成本分析显示了经济性。网络成本是由多区域集群中的跨区域网络流量产生的,这类集群比单区域集群更稳定且扩展更快。当用户配置单区域集群时,可以避免这种成本。对于100万张图像的运行进行了一次基准测试,其他情况下进行了三次重复测试。误差条代表重复测量的标准差。c,DeepCell Kiosk能够构建和扩展多模型管道。例如,活细胞成像消费者可以访问用于分割和跟踪的深度学习模型。活细胞成像消费者将电影帧放入分割消费者的队列中,并在那里并行处理。分割完成后,图像由跟踪消费者处理,以随时间链接细胞并构建谱系。结果包括分割和跟踪细胞的标签图像以及描述母女关系的JSON文件,这些结果被上传到云存储桶,用户可以从那里下载。