掌握Python,解锁单细胞数据的无限可能

学术   2025-01-20 17:32   黑龙江  

单细胞数据分析炙手可热,python在单细胞分析里占据的地位也越来越重要。

因为 很多工具是基于python原生态开发的,而且在Python编程环境下运行速度会是R编程语言的10倍以上。 比如转录因子分析,它作为单细胞的3大高级分析,大家应该是不再陌生,我们也多次介绍过:

因为在R里面跑这个,超级耗时,所以我们也介绍了Python版本: 使用pyscenic做转录因子分析没想到自己会放弃conda(docker镜像的pyscenic做单细胞转录因子分析),大家可以按需取用。

据scRNA-tools网站统计,目前的单细胞数据分析的近一千八百个工具中,各种编程语言开发的工具所占比例是:

也就是说,仅仅是会R编程语言有时候会部分高级分析望洋兴叹,而且大量的高分文献在公布他们的代码在github的时候我们也可以很明显的看到必须是R和Python两手抓了,比如2024的NC文章:《Single-cell and spatial transcriptomics analysis of non-small cell lung cancer》的代码就是:

所以我们开了python单细胞系统学习的课程啦!

正式课程和内测课程的区别

2024年的12月,我们已经面向老学员和老粉丝们开放了内测课程,目前课程已近尾声。内测期间:

  1. 我们已完善和改进了课程内容,课表比原来的设计有所更新,细节进行了很多优化。

  2. 准备好了详实、友好的学习资料、示例数据和代码、练习和文档等。

    配置好的python版本、包库版本+完整代码的jupyter notebook资料,是满满的诚意,真心要教会你!

  1. 收集了常见问题文档,学习不可能不遇到问题,我们要学会面对问题并解决问题呀。

  1. 团队成员们以文字、图片、语音、拉小群沟通和远程控制等多种方法为大家解决疑难问题,参与内测的同学们也积极沟通和讨论,互帮互助。团队积累了更多解决问题的经验,可以更好地为大家保驾护航!

随便截了几张图,只是我们幕后工作的冰山一角:

(注:截图中有提到服务器,并不是必须的)

经多方调研和团队协调,我们把开课时间定在正月十一,如果你想要提前学习,我们可以为你开放内测课程的回放,相当于你可以拿到两个版本的课程,内测课程的回放+正式课的直播和回放。诚意满满,早报名早学习!

已报名内测课程的老同志们,组织也不会忘了你,如果内测期间因各种原因错过了直播,或者感觉没有学透彻,你可以申请继续参加本次课程,不加钱的,但你要向招生老师反馈原因,并保证这次有充足的时间学习,跟上进度哦。

📅 课程时间

2月8日(正月十一)开始,钉钉线上互动直播课,共10次课。

2月8日(周六)和2月9日(周日),前2节课程的上课时间是上午9:30~12:00

后面的8节课上课时间是晚上8:00-10:30

🎯 课程目标

  • 熟练使用Python。

  • 掌握单细胞数据分析的全套流程,可以独立分析自己的数据。

  • 具备进阶分析和自定义需求的探索自学能力,和解决问题的能力。

💪基于Python分析单细胞数据的优势

  • 多平台兼容:在win、mac和linux系统上均可使用

  • 计算效率高:比起R语言更省计算资源,自己的电脑可以处理更大的数据,计算速度快,效率高。

  • 可以和R语言结合使用:jupyter notebook里面可以嵌入R语言的脚本,如果你熟练使用R语言,分析结果可以转换为R语言可读取的格式,用R语言的ggplot2画图;也支持读取R语言的Seurat的结果进行后续分析。

  • gpt很会python:gpt降低了我们的学习成本,写Python的代码正确率高。

  • 可扩展性更强:很多单细胞数据分析的新工具是基于python开发的,还可以衔接Python强大的机器学习和深度学习工具,进阶分析有无限可能!

📚 课程大纲

第1课:Python环境搭建与基础

  • 软件安装(Windows、Linux、Mac)

  • 文件目录管理

  • Conda环境管理

  • 镜像设置

  • 包/库安装方式

  • Jupyter Lab安装和使用

第2课:Python编程基础

  • python语法规则

  • 函数、方法、属性

  • 包、库、模块

  • 变量赋值与数据类型

  • 列表的生成和取子集

  • 字典的生成和取子集

第3课:Python数据处理

  • 列表排序、统计和去重

  • 矩阵的新建和取子集

  • 数据框的新建、取子集和属性探索

  • 推导式

  • 条件语句和循环语句

第4课:数据可视化

  • seaborn和Matplotlib绘图

  • plotnine绘图

  • 自定义颜色+配色包

  • 图片设置

  • 拼图和图片保存

第5课:Python进阶

  • 缺失值处理

  • Apply隐式循环

  • Groupby完成分组计算

  • Python综合应用

第6课:单细胞数据分析基础

  • 环境搭建和包库安装

  • 背景知识介绍

  • Anndata对象构建和认知

  • 质量控制和基因、细胞过滤

  • 降维(PCA、t-SNE和UMAP)

  • 聚类、分群

第7课:单细胞数据注释与可视化

  • Marker基因的多种可视化方法

  • 基于marker基因的手动注释

  • 任意分组的差异分析及其可视化

  • 提取细胞亚群进行二次分群

第8课:多样本整合和注释

  • 多样本数据读取

  • 用Harmony完成多样本整合

  • 自动注释工具singler

  • 自动注释工具Celltypist

  • 不同格式的原始数据读取与格式转换

第9课:富集分析和拟时序

  • 基因集合的获取

  • 基于基因集给细胞打分

  • 富集分析:ORA和GSEA

  • 拟时序分析工具PAGA和dpt

  • 拟时序分析工具palantir

第10课:高级分析和综合应用

  • RNA velocity

  • pySCENIC转录因子分析

  • 数据分析复现

  • 文献应用举例

  • 与R语言的衔接

  • 课程总结

我们的课程已基本涵盖了单细胞转录组分析的方方面面,并且包含了完成这些分析所需要的理论基础和编程基础,并协助解决问题和教你学会解决问题,绝对的管杀管埋,诚意满满!

图片出自:Single-cell RNA sequencing technologies and applications: A brief overview


📢 后续学习和答疑

  • 课程提供录播回放,有效期一年,错过直播也不怕

  • 提供示例数据和代码、课件、练习题,方便复习和实践

  • 生信技能树教学团队自营,可开发票

  • 课程结束后半年内微信群会继续提供课程答疑(答疑结束后学员群也不会解散,继续给大家分享学习资料),还有每月一次的讲师直播答疑哦,不限参与次数和时间,我们偶尔有2020年的学生都还可以参与直播答疑呢,大多数人出师了已经不需要答疑啦!

  • 我们的幕后团队正在持续输出详尽的文字版资料,介绍前沿进展和高级分析,届时大家已经具备了自学能力,打开知识的大门,一切尽收眼底!

📷部分图表



具体的图表数量再多也是有限的,我们更注重的是帮助你搞定基础、方法和规律,授人以渔~

🎓适合人群

  • 生物学、医学、生物信息学背景的学生、医生和科研人员

  • 有单细胞分析需求的公司职员

  • 新手适用,不要求有编程基础,但要求有积极性哈哈

👨‍🏫 教学团队

生信技能树直播课原班人马:小洁老师、大萌老师及助教老师,拥有丰富的教学经验和海量的资料库、智囊团!

📱 学费和报名方式

学费1599元,已包含10节课程的直播和回放、课后答疑、学习资料等所有费用。

加微信咨询,付款完成后,即可加入微信群和钉钉群,开始做准备工作,拿到内测回放,开启你的python和单细胞数据分析之旅!

🚀 选择生信技能树不仅仅是学到分析方法,参加培训相当于进入生信技能树小圈子,解锁更多学习资料以及学习方法!

生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
 最新文章