单细胞转录组专题课程| Scanpy生态教程第一讲:配置分析环境

文摘   2025-01-06 08:01   内蒙古  
        同学们,大家好!学生信,做分析,就上凌波微课。欢迎大家关注我们,加入凌波微课交流群,参与我们的课程和课下交流。今天给大家分享的内容来自公众号生信会客厅,很荣幸邀请到Kinesin老师,为我们带来Scanpy生态教程系列课程第一讲——配置分析环境。

微信号丨生信会客厅

欢迎关注

单细胞生物信息学近年来经历了爆炸式的发展,除了以Seurat为代表的众多杰出R包形成的单细胞分析R语言生态,还有很多python库围绕Scanpy构成了同样优秀的python生态。两个生态的工具都能独立实现单细胞数据的质控、细胞注释、差异表达与功能富集分析、轨迹推断、转录调控网络分析和细胞互作等核心内容的分析,并且很多工具既有R语言版又有python。初学单细胞分析的朋友不必纠结哪个生态更好或更有前途,其实掌握其中一种后“跨界”学习另一种是非常容易的。如果您没有任何编程基础,又对深度学习和人工智能感兴趣,那就选择python吧。本教程将从配置分析环境开始,用10多篇帖子系统介绍Scanpy生态中一些常用工具的使用,不足之处欢迎大家批评指正!
一、下载安装anaconda
登录网址:
https://www.anaconda.com/download
文件名称:
Anaconda3-2023.09-0-Windows-x86_64.exe

按默认设置安装anaconda3,安装完成后有以下几个软件添加到了程序开始菜单:

  • Anaconda Navigator:图形用户界面,用于启动和管理应用、创建新环境以及安装、更新和卸载包。

  • Jupyter Notebook:基于web的交互式计算环境,支持实时代码、方程、可视化和markdown文本混合的文档。

  • Spyder:集成开发环境(IDE),专为科学计算设计,内含调试器、文件浏览器和变量查看器等功能。

  • Anaconda PowerShell Prompt:基于PowerShell语言的命令行操作界面。

  • Anaconda Prompt:基于CMD语言的命令行操作界面。


二、配置channels

Conda最基础的功能是包的安装与管理,用它安装包时不用我们提前下载好相关包的源文件或编译文件,只需要我们提供包的名称就可以安装。这是因为conda有默认的在线软件仓库,接收到我们包的安装指令后,它自动到软件仓库中寻找与系统和环境兼容的包下载并安装,这个在线软件仓库在conda中称作:Channel。除了conda官方默认的channel,还有第三方的channels(如社区驱动的conda-forge,专为生物信息学领域定制的bioconda),以及各种channels的国内镜像。

在程序开始菜单找到并打开Anaconda Navigator,按图所示依次点击1和2后,在红框区域依次输入conda-forge和bioconda。


Channels添加完成后如下图所示多了一些网址,最后点击更新频道。

三、在conda环境中安装包
Conda虚拟环境(Conda Virtual Environment)是一种在Anaconda或Miniconda中创建的独立且隔离的Python环境。它允许用户为不同的项目或任务创建单独的环境,每个环境中可以安装特定版本的Python以及其他依赖包,而这些环境之间互不影响。

我们使用命令行创建一个专门用于单细胞分析的python虚拟环境,请在windows程序菜单中找到Anaconda Powershell Prompt并打开。


在命令行界面中依次输入以下命令创建环境并安装分析包

# 创建名称为scanpy,python版本为3.10的虚拟环境conda create -n scanpy python=3.10 --yes# 激活scanpy环境conda activate scanpy# 安装jupyter notebook内核,-i参数指定了清华镜像作为安装包来源,可以加快安装速度。pip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simplepython -m ipykernel install --user --name scanpy --display-name "Scanpy"# 安装常用分析包pip install scanpy -i https://pypi.tuna.tsinghua.edu.cn/simplepip install pooch -i https://pypi.tuna.tsinghua.edu.cn/simplepip install scrublet -i https://pypi.tuna.tsinghua.edu.cn/simplepip install doubletdetection -i https://pypi.tuna.tsinghua.edu.cn/simplepip install bbknn -i https://pypi.tuna.tsinghua.edu.cn/simplepip install scanorama -i https://pypi.tuna.tsinghua.edu.cn/simplepip install gseapy -i https://pypi.tuna.tsinghua.edu.cn/simplepip install adjustText -i https://pypi.tuna.tsinghua.edu.cn/simplepip install cellphonedb -i https://pypi.tuna.tsinghua.edu.cn/simplepip install ktplotspy -i https://pypi.tuna.tsinghua.edu.cn/simplepip install palantir -i https://pypi.tuna.tsinghua.edu.cn/simplepip install infercnvpy -i https://pypi.tuna.tsinghua.edu.cn/simpleconda install -c conda-forge fa2# 退出当前虚拟环境conda deactivate
### pyscenic环境conda create -n pyscenic python=3.10 --yesconda activate pyscenicpip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simplepython -m ipykernel install --user --name pyscenic --display-name "pySCENIC"#新版本numpy导致module 'numpy' has no attribute 'object'的报错,因此指定版本pip install numpy==1.23.5 -i https://pypi.tuna.tsinghua.edu.cn/simplepip install scanpy -i https://pypi.tuna.tsinghua.edu.cn/simplepip install pyscenic -i https://pypi.tuna.tsinghua.edu.cn/simpleconda deactivate

以下是我的命令执行结果截图,没用过命令行终端的朋友可以参考。


四、安装Jupyter Notebook扩展插件
原生的Jupyter Notebook功能有些简陋,我们可以安装nbextensions插件来丰富它的功能。请在命令行界面依次执行以下界面。
conda activate basepip install jupyter_contrib_nbextensions -i https://pypi.tuna.tsinghua.edu.cn/simplejupyter contrib nbextension install --userpip install jupyter_nbextensions_configurator -i https://pypi.tuna.tsinghua.edu.cn/simplepip install yapf -i https://pypi.tuna.tsinghua.edu.cn/simple

nbextensions的主要功能有:

  1. Table of Contents (2) :在 Notebook 的侧边栏生成一个交互式的目录,方便用户快速导航到文档的不同部分。
  2. Codefolding:提供代码折叠功能,允许用户隐藏或展开特定的代码块,使长篇幅代码更易于管理和阅读。
  3. Collapsible Headings:允许用户点击标题以折叠或展开整个子部分的内容,有助于组织大型 Notebook 的结构。
  4. Execute Time:在每个代码单元格旁边显示执行该单元格所需的时间。
  5. Variable Inspector:显示当前 Notebook 中所有变量的名称、类型以及值,便于监控和调试程序中的变量状态。
  6. Spell Checker:自动检查 Markdown 单元格中的拼写错误,并提供修正建议。
  7. Hinterland:为代码单元格提供自动补全功能,提升编程效率。
  8. Code Prettify:优化代码格式化,使得输出的代码更加美观易读。

五、启动Jupyter Notebook
大家可以在windows程序菜单中找到Jupyter Notebook并打开,查看咱们的分析环境是否配置成功。

咱们依次点击Files->New,看看Scanpy的环境是否可以显示。

在点击Nbextensions选项卡后勾选一些自己喜欢的辅助功能,点击之后可以在下方看到插件的详细说明。


生信会客室


生信会客厅是一个专注于分享单细胞及空间转录组分析代码和经验的个人公众号。创办人Kinesin拥有十年高通量测序行业从业经历,并积累了五年的单细胞与空间转录组项目个性化分析经验。在这里,Kinesin不仅传递专业知识,更致力于为生物信息学爱好者和从业者提供一个交流学习的平台。

往期精彩

凌波微课|单细胞转录组实操系列课程(五):细胞类型注释

凌波微课|单细胞转录组实操系列课程(四):多样本整合分析

凌波微课|单细胞转录组实操系列课程(三):单样本分析

凌波微课|单细胞转录组实操系列课程(二):各种输入文件的读取方式

凌波微课|单细胞转录组实操系列课程(一):什么是单细胞转录组测序?
凌波微课|生信分析过程中常见的文件格式
凌波微课|转录组系列专题(五):UMI转录组真精准——转录组绝对定量
凌波微课|转录组系列专题(四):全长转录组详解
凌波微课|转录组系列专题(三):真核转录组详解
凌波微课|转录组系列专题(二):原核转录组详解
凌波微课|转录组系列专题(一):转录组的那些事儿

凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。

凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。倾心打造的高通量测序数据分析平台——凌波微课·云平台(http://www.cloud.biomicroclass.com/CloudPlatform/home),无需命令行,零基础玩转数据分析。凌波微课,用心服务科研用户,打造专业教育品牌,助力科研提升。

关注我

发现更多精彩

关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!

凌波微课
凌波微课旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。用心服务科研用户,打造专业培训品牌,助力科研提升。
 最新文章