Hi-C数据的可视化工具汇总

学术   2024-12-21 07:06   北京  

染色质高级结构作为基因调控机制中的重要组成部分,其对应Hi-C数据的可视化工具随着研究的深入愈发丰富多样。不仅有R、python编写的实用整合包,也有更加便捷的网页化工具和docker,这极大地便利了Hi-C数据的可视化和整合,提高了分析效率。这里我们总结了目前使用较为普遍的Hi-C数据可视化工具,总有一款适合你!


Hi-C数据的可视化工具汇总
Hi-C分析工具速览

python包
CIRCHIC
pyGenomeTracks
CoolBox
HiCPlotter
 trackplot

网页可视化工具
Nucleome Browser
HiCognition
HiBrowser
HiCrayon

 R包
GENOVA
HiCBricks
plotgardener
HiTC

docker
HiGlass
HiCube

Linux平台软件
gcMapExplorer
HiCExplorer
Juicebox

Hi-C分析工具速览

图1 以上列举了目前使用较为广泛的Hi-C数据分析工具,不同格式的输入文件可以通过HiCExplorer进行格式转换。


python包

CIRCHIC

CIRCHIC:CIRCULAR VISUALIZATION OF HI-C DATA AND INTEGRATION OF GENOMIC DATA(HI-C 数据的环形可视化和基因组数据的整合)

circHiC 是一个 Python 库,建立在广泛使用的 Matplotlib 库之上,以圆形条带显示类似 Hi-C 的数据,并可以叠加基因组数据(绘图和热图)。工具轻便快速,旨在促进对细菌染色体结构数据的探索和理解。

pyGenomeTracks

一款十分强大的python包,可用于绘制漂亮的基因组track图,支持bigwig、bedgraph、Hi-C、matrices、fasta、maf、bed、gtf 等多种数据格式。

CoolBox

一款对使用者极其友好的多组学数据交互式可视化工具,可在 Jupyter 笔记本中显示。其绘图系统主要基于pyGenomeTracks。

HiCPlotter

HiCPlotter 是一个 Python 数据可视化工具,用于将不同的数据类型与交互矩阵集成。

HiCPlotter是由Kadir Akdemir在美国德克萨斯州休斯顿的德克萨斯大学MD安德森癌症中心的Lynda Chin实验室设计。


trackplot

trackplot 是一种可视化各种NGS数据的工具,包括 DNA-seq、RNA-seq、单细胞 RNA-seq 和全长测序数据集。

trackplot 的特点:

  1. 1.支持各种文件格式作为输入

  2. 2.支持strand aware coverage图

  3. 3.通过热图(包括Hi-C图)可视化覆盖范围

  4. 4.基于给定基因ID可视化蛋白质结构域

  5. 5.将使用细胞条形码的单细胞RNA/ATAC-seq分解为细胞群

  6. 6.支持以逐读样式可视化单个全长读长

  7. 7.支持可视化circRNA测序数据


网页可视化工具

Nucleome Browser

3D 基因组和表观基因组联盟,包括 4D Nucleome (4DN) 项目,已经生成了大量多模态数据集,其重要目标是为一组真核细胞提供细胞核 3D 结构的试点参考图。Nucleome Browser有效解决了如何以交互方式可视化这些多模态数据,帮助不同领域的研究人员有效地探索不同规模的多模态、异构数据集。

图 1 用户可以使用 Nucleome 浏览器以交互方式探索基因组数据、成像数据和 3D 结构模型,并提出新的假设。在此示例中,左侧的两个基因组浏览器面板显示了 18 号染色体中人类 H1 和 K562 细胞之间 3D 基因组组织的多种数据集的比较。这些track包括 45 度的 Hi-C contact heatmap、TSA-seq 和靶向不同细胞核的 DamID track,以及预测的 SPIN 状态等。两个高亮区域表示两个细胞类型间具有差异profile的区域。与右侧 K562 的数据相比,左侧突出显示的区域显示了 H1 中 LaminB TSA-seq 评分相对较低的两种细胞类型之间的差异区域,而右侧突出显示的区域表示两个细胞之间的保守层相关区域,与 SPIN 状态的预测一致。实时散点图会随着用户使用鼠标移动突出显示的区域而交互式地更新自身。在右侧,从 H1 细胞中的 Hi-C 数据得出的 3D 结构模型证实,左侧突出显示的区域(颜色表示 LaminB TSA-seq 评分的信号)位于细胞核内部,而保守的层相关区域位于细胞核外围。如果用户单击针对保守区域的 FISH 成像的缩略图,则会弹出 OMERO.iViewer。
图2 此外可以创建了一个自定义网页,以将 HiGlass 会话与 Nucleome 浏览器同步。可以通过 http://vis.nucleome.org/static/apps/higlass/访问此网站。当在基因组浏览器上导航时,HiGlass 查看器也会相应地更新其基因组坐标,还支持同步高亮显示。

图3 还可以在 Jupyter notebook 中使用 JavaScript,并使用 Chrome 扩展 Nucleome Bridge 将本地 Jupyter 笔记本连接到 Nucleome 浏览器。通过python将鼠标的点击和选中及时转变为notebook的图形。


HiCognition

HiCognition 是一种网页化的数据探索工具,允许对整合基因组数据进行简化探索。HiCognition以 Hi-C 数据为中心,但也支持 ChIP-seq 和基于区域的数据的集成。


HiBrowser

可自行本地化部署,支持上传本地数据并网页展示数据,缺点是无法导出矢量图进行后期编辑。

HiCrayon

综合Hi-C/ChIP/RNA等数据的可视化的网页工具,支持docker本地化部署。


R包

GENOVA

GENome Organisation Visual Analytics (GENOVA)作为一个软件套件,使用 Hi-C 数据对基因组组织的各个层次进行深入分析。GENOVA促进了多个数据集之间的比较,并支持大多数映射管道。GENOVA可快速汇总和可视化 Hi-C 数据,可以生成一套全面的出版质量图,使研究人员能够快速从原始 Hi-C 数据转化为可解释的结果。


HiCBricks

HiCBricks 是一个专为处理大型高分辨率 Hi-C 数据集而设计的R包。HiCBricks 利用 HDF (分层数据格式) 文件来有效处理大型 Hi-C 接触矩阵。HiCBricks 实现了一种称为 Brick 对象的 Hi-C 特定的 HDF 数据结构,它引入了一个简单的 S4 类 BrickContainer,用于跨分辨率跟踪 Brick 对象,并提供了访问器功能,允许用户访问和操作 Hi-C 数据,而无需处理 HDF 文件的复杂结构。



plotgardener

plotgardener 是一个用于 R 的基因组数据可视化包。plotgardener 使用网格图形,使用户能够以编程方式灵活地生成多面板图形。PlotGardener 通过利用 1) 基于坐标的绘图系统和 2) 边到边容器化数据可视化来实现这些目标。基于坐标的绘图系统允许用户精确控制绘图的大小、位置和排列。它的边到边绘图功能保留了用户指定的容器和表示的数据之间的映射。这使用户能够放心地堆叠绘图,确保垂直对齐的数据将对应于相同的区域。


HiTC

HiTC是最早参与Hi-C计算的Job Dekker实验室于2012年开发的R包,因发表时间距今较远,图形绘制亦较为简陋,已不再推荐。


docker

HiGlass

HiGlass 是一种用于大型 Hi-C 和其他基因组数据集的快速可视化工具(docker)。它是由哈佛医学院的Gehlenborg 实验室与哈佛大学约翰 A. 保尔森工程与应用科学学院的视觉计算小组和麻省理工学院的米尔内实验室密切合作创建的,作为 4D 核组项目数据协调和集成中心的一部分。可以对多组Hi-C数据样本进行同步化操作,并进行多组学数据的整合。

HiCube

HiCube 是一个 基于HiGlass的Web 应用程序,提供多尺度和多模态 Hi-C 和 3D 基因组数据的交互式可视化。

HiCube 提供以下独特的特性和功能:

  1. 1.样本案例的同步操作

  2. 2.更高分辨率的缩放视图

  3. 3.添加可配置的注释


Linux平台软件

gcMapExplorer

它是一个从 Hi-C 实验生成的contact maps的可视化和分析平台。该软件包的开发考虑了非常精细分辨率的接触图的巨大尺寸。它包含图形用户界面,具有多个窗口,可执行导入 Hi-C 数据、将 bigWig/wig/bed 转换为 h5 、归一化 Hi-C 映射等命令。


HiCExplorer

HiCExplorer是用于处理、分析和可视化 Hi-C 和 cHi-C 数据的程序集。HiCExplorer 有助于创建接触矩阵、矫正contact map、TAD detect、A/B compartment、数据格式转换等。此外,它还允许可视化多个接触矩阵以及其他类型的数据,如基因、compartment、ChIP-seq coverage tracks(包括任何类型的基因组得分)、远程接触和viewpoints可视化。


Juicebox

Juicebox 是用于 Hi-C 实验的可视化软件。使用 Juicebox,可以

  1. 1.通过实时放大和缩小多个量级的分辨率来可视化 Hi-C 图

  2. 2.将Hi-C图谱与ENCODE轨道、基因、loops/domains、其他Hi-C图谱等进行比较

  3. 3.探索已发表的Hi-C实验的数据存档

  4. 4.通过使用Juicer工具创建map并在 Juicebox 中打开它来加载自己的Hi-C数据




最新文章汇总(持续更新ing)


最新热点方向

1、这个科研方向已经不适合临床医生

2、Science:脊髓损伤后的神经再生重大突破

3、全网最全!哈佛生信女神刘小乐团队研究成果汇总

4、Cell Stem Cell最新综述:肿瘤干性的标志

5、Cell重磅:樊嘉院士、高强教授联合发表!中性粒细胞又有新状态了!


生信人课堂

1、多组学水平的孟德尔随机化分析套路

2、单细胞+空转王炸组合,探索骨骼肌纤维化巨噬细胞

3、以小博大,紧张刺激:肿瘤耐药研究,从基因到网络

4、零基础入门-单细胞课程

5、史上最全格局打开,细讲基因组学,确定不来学学?


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多


生信人
共同学习生物信息学知识,共同探究生物奥秘。
 最新文章