scATAC | 使用Liger v2整合单细胞转录组和染色质开放数据

文摘 2024-07-06 16:31 江苏

🔗scRNA-seq 、🔗scRNA-seq高级分析、🔗scATAC-seq、 🔗R包开发、🔗源码拆解、 🔗测试、🔗RNA-seq 、🔗其它生信分析、 🔗R语言、🔗Python 、🔗环境配置、🔗文献分享、 🔗一只羊的碎碎念

在上篇文章中我们绘制了染色质开放和基因表达的关系，今天我们将学习使用Liger包来整合单细胞转录组和单细胞染色质可及性数据。对不同的数据集进行整合，数据集之间需要有一些共有的对象来作为feature，并且这些feature在不同的数据集之间应当存在着某种整体上的相关性（例如某一个基因越开放，则通常它的表达量就越高；某一个基因body上非CpG甲基化程度越高，则该基因通常就越处于沉默状态）。对于ATAC-seq等表观组的数据，我们通常使用peak来表征其在某一个位点上的强弱。尽管我们也可以统计各个基因上的peak数量来作为ATAC-seq的表达矩阵，但Liger的作者认为这么做的效果可能并不理想，原因有以下三点：

(1) peak calling is performed using all cells, which biases against rare cell populations; 
(2) gene body accessibility is often more diffuse than that of specific regulatory elements, and thus may be missed by peak calling algorithms; 
and (3) information from reads outside of peaks is discarded, further reducing the amount of data in the already sparse measurements.

Liger作者发现，使用scATAC-seq在基因body和promoter上的reads数就能很容易地表征某个基因的整体开放性水平：计算每个细胞中每个基因的基因body和启动子区域（通常为上游几kb）内的scATAC-seq reads的总数。

近期，Liger也升级到了v2，运行速度大大提升。同时也对算法和使用的函数进行了升级，简单了，但和seuratv5的升级一样，很多函数也进行了升级——一些教程可能就落伍了。中文环境下似乎还没看到v2的介绍，好吧，人家也是今年刚进行升级。

本文主要为scATAC-seq和scRNA-seq整合这部分的教程。完整流程需要文件：研究对象的gtf、cellranger atac获得的fragments.tsv.gz、barcodes.tsv，以及对应的scRNA-seq数据就可以了。

官方教程：https://welch-lab.github.io/liger/articles/Integrating_scRNA_and_scATAC_data.html

本篇教程同样是适用于任何物种的通用流程，变量名和官网稍有不同，对照着看就好。包含以下内容：

bed格式文件准备
scATAC-seq 数据准备
构建Liger对象
预处理
Liger整合scRNA和scATAC对象及可视化

让我们从cellranger atac输出结果开始吧。

cd ~/sample/outs/sort#cellranger atac输出路径下新建了一个sort路径，打开
gunzip ../fragments.tsv.gz

http://mp.weixin.qq.com/s?__biz=Mzg2MjEzNjE2MQ==&mid=2247495434&idx=1&sn=37fe863300a1353c06743b707956265a

你好我是一只羊

个人号，内容主要涉及种质资源、分子标记开发及遗传多样性分析，表观遗传、编程语言在生物信息学中的应用、转录组、基因组、单细胞测序多组学数据分析等；其它更新平台：B站&小红书-一只羊做生信/捡羊毛的咩/生信小羊🐑

最新文章

【代码】Ro/e分析量化单细胞亚群分布偏好

文献分享 | 烟草幼苗期单细胞转录组图谱 | 植物单细胞互作分析

【代码】美化 | 单细胞转录组多组差异基因火山图/环形火山图

【视频+代码】CellPhoneDB v5 | CellPhoneDB v5 可视化之网络图和贝壳图

文献分享 | 拟南芥叶片感染假单胞菌的单细胞图谱

【视频+代码】CellPhoneDB v5 | CellPhoneDB v5 可视化之热图改进

【视频+代码】CellPhoneDB v5 | 下载安装、代码实操及结果解读

单细胞转录组高级分析 | CellPhoneDB v5简介

环境配置 | homer安装

环境配置 | MACS2简介

【视频+代码】使用Liger进行综合非负矩阵分解(iNMF) | 不同批次/平台/物种/模态整合方案

【视频】跟着Cell Metabolism学作图 | 使用Plot1Cell包绘制单细胞降维图

【单篇付费】细胞分化分析|monocle1原理

【单篇付费】高级分析之细胞分化 | monocle2原理

【单篇付费】高级分析之细胞分化 | monocle2安装及实战

年中回顾 | 一只羊的2023年总结&2024规划

提供10G+练习数据，零基础做ER，柳叶刀，Nature的技术方案：影像组学人工智能实操培训班＋数据委托实验

Linux | shell脚本封装模板（内含资源分享）

高通量测序 | 高通量测序的发展历程（内含资源分享）

分子标记 | popgene32使用限制

文献分享 | 武汉大学王坤教授和周宇教授团队利用单细胞技术发现棉纤维细胞昼夜节律性生长的调控机制

文献复现4 | 人类肝细胞图谱2

文献复现3 | 人类肝细胞图谱1-数据下载

scATAC | 桑基图可视化liger整合结果（包含NA值的处理）

【单篇付费】细胞分化分析|轨迹分析的基本概念

【单篇付费】细胞分化分析|轨迹分析的基本概念2

【单篇付费】Cellranger单细胞转录组上游分析流程回顾|非人/小鼠特殊物种gtf文件修改添加线粒体、叶绿体标记

高级分析之细胞分化 | monocle2安装及实战

单细胞实战-拟南芥根(3)-使用monocle2构建细胞分化轨迹

scATAC | 使用Liger v2整合单细胞转录组和染色质开放数据

生信不要总是局限在预后模型

scATAC|如何描述基因表达与染色质开放的相关性

哇塞！你敢信？生信领域要“变天”了新技术问世，将打破困扰科研界长久以来的难题！

2019-2024年上半年单细胞多组学在植物研究中的发文情况

文献分享 | 浙江大学樊龙江团队绘制首张水稻种胚单细胞时空图谱

小技巧|使用GenomicFeatures包轻松获得基因长度

表观遗传|ChIP-seq、CUT&Tag和CUT&RUN

高级分析之细胞分化 | monocle2原理

文献分享 | 拟南芥茎尖的单细胞转录组分析

scATAC | 使用Cell Ranger ATAC进行上游分析（适用于非人/小鼠）

Nature重磅 | 颠覆认知：华人学者首次揭示“表观遗传”由细胞质中“无名小卒”精细调控！

文献分享 | 整合单细胞分析揭示肾透明细胞癌的转录和表观遗传调控特征

文献分享|水稻根尖单细胞转录组及染色质可及性图谱

多端同步|Typora+GitHub+jsDelivr+Picgo搭建图床

生信指北|开源第一步，GitHub白嫖学生包认证流程

表观多组学|DNA甲基化相关基础知识

RNA-seq|样本相关性散点图

测试|cytotrace v1使用不同细胞数对结果的影响

代码笔记容易忘？推荐这款Markdown写作神器Typora（附MAC版下载）

文献分享-2023-scPlant：植物单细胞转录组数据分析的框架

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉