Pore-C数据评估新方法与新指标：揭开多维基因组互作的奥秘

学术 2024-11-20 17:12 湖北

点击蓝字关注我们

随着Pore-C技术的出现，基因组学研究迎来了强大的工具，能够揭示染色质三维结构及其复杂的互作关系。相比于传统的 Hi-C技术，Pore-C不仅能捕获更长的DNA片段，还能提供多个基因组位点的互作信息，甚至包括甲基化修饰等表观遗传信息。然而，如何充分利用这些丰富的数据进行分析和评估，仍然是一个挑战。本文将对比Pore-C与Hi-C技术，介绍一种全新的Pore-C数据评估方法，帮助研究人员更好地利用Pore-C数据揭示基因组的多维结构。

1. Pore-C与Hi-C实验流程差异

a. Hi-C实验技术

Hi-C技术是基于高通量测序的染色质构象捕获技术，通过固定染色质互作、酶切、末端修复、环化、捕获互作片段并进行二代测序，揭示染色质三维结构。其具体的实验流程如下：

b. Pore-C实验技术

Pore-C技术基于染色质构象捕获技术（3C），结合第三代Nanopore测序，能够直接测序包含多个DNA相互作用片段的长链DNA，捕捉到更复杂的染色质互作结构。其实验流程如下：

Pore-C技术的优势在于：

• 实验流程更简单，无需生物素标记和PCR扩增。

• 能直接测序多个相互作用的DNA片段，捕获**Multi-contact**信息，揭示更高阶的染色质结构。

• 可同时获得DNA甲基化等表观遗传修饰信息。

虽然Pore-C技术能够提供甲基化修饰信息，但本文的重点将放在互作信息的评估上。

2. Pore-C与Hi-C分析方法差异

2.1 Hi-C的成熟数据分析流程：

a. Raw reads过滤：与常见的二代测序数据处理类似，首先进行质量控制和过滤。

b. 序列比对：将pair-end测序的reads比对到参考基因组。

c. 定位酶切位点：通过比对结果，找到reads pairs在基因组中的物理位置，并根据插入片段大小的限制，确定酶切位点。酶切位点代表DNA相互作用的大致位置。

d. 筛选有效比对片段：选取位于酶切位点两端且方向相反的reads pairs。

示意图如下：

2.2 Pore-C的分析流程：

Pore-C数据的分析与Hi-C有所不同，主要体现在如何处理测序reads以及如何从中提取有效的互作对。

以下是一个Pore-C测序reads的示例：

a. reads示例情况：

reads总长度：5400bp

A:1200bp B:1500bp【B1:700bp和B2:800bp】 C:2000bp D:300bp【D1:120bp和D2:180bp】 E:400bp

b. 方法一：采用“先酶切再比对”的策略。

相关流程：https://github.com/epi2me-labs/wf-pore-

c.具体步骤如下：

i. 根据酶切位点将DNA片段切开，形成携带reads标签的fragments。

ii. 将这些fragments比对到参考基因组。

iii. 根据fragments对比对结果和携带的reads标签组合成pairs，再进行过滤，提取有效的互作对（pairs）。

示意图如下：

这种方法在Pore-C数据分析中存在一些局限性。由于Pore-C的测序reads较长，实际未被酶切开的片段可能在生信算法中被过度切割，导致：

• 多位点比对：多个片段比对到基因组的不同位置，增加了误判的概率。

• 比对失败：部分片段可能无法准确比对到参考基因组，降低了有效数据的比例。

pairs数据比对示意图：

这种方法在Pore-C数据分析中存在一些问题，特别是酶切位点的密度可能导致实际未被切开的片段在生信算法中被过度切割，进而导致多位置比对或比对失败的概率增加，影响最终的有效数据率。

c. 方法二：为了充分利用Pore-C的优势，我们建议了一种新的分析策略：“先比对再剪切”。

相关流程：HiPore-C pipeline

具体步骤是：

i. 先将长reads完整地比对到参考基因组。

ii. 根据比对结果确定片段的相对位置，再进行剪切为fragments。

iii. 结合fragments和酶切位点，进行过滤，提取有效的互作对（pairs）。

这种方法类似于全长转录组测序的分析方法，能够更好地利用Pore-C的长reads特性，减少多位点比对或比对失败的情况，显著提高有效数据率。

示意图如下：

d. 两种方式计算数据有效率的差异

模型示意图的计算示例：

实测数据评估：

e. 数据意义：

Mean Fragment Count，可以看出平均多少个位点在一起互作；

Mean Fragment length，可以看出平均酶切的片段长度；

Total Valid Pairs，类似二代的有效数据率，可以看出总的有效互作数，以及效率占比；

Mean Valid Pairs Length，可以看出有效互作对的平均长度；

Contacts/Reads比，即Valid Pairs / Total Pairs，可以看出平均每条Reads提供的有效互作数目；

Valid Size/Total Size，可以看出测序数据的有效利用率；

‍

3. 总结

Pore-C相比Hi-C具有显著的优势，尤其是在测序片段长度方面。每条Pore-C测序reads能够提供更多的互作信号，因此不能采用“先酶切再比对”的策略方法来评估Pore-C数据。该方法会显著低估Pore-C的Total Valid Pairs占比，无法充分展示Pore-C在多维互作方面的优势，而“先比对再剪切”的策略方法恰恰可以弥补这个不足，做到对Pore-C互作信息的准确评估。

此外，在追求Pore-C reads的N50或平均长度时，我们也需要注意，长度越长并不总是意味着Mean Fragment Count越多。有时，片段长度较大可能只是因为酶切后的片段较大。因此，在质控Pore-C数据时，使用基于比对的方法能够更加有效，同时结合Mean Valid Pairs Length和Contacts/Reads比，可以更好地评估数据的有效性。

‍

Pore-C技术为基因组三维结构研究带来了前所未有的机会。相比Hi-C，Pore-C不仅能够捕捉到更长的DNA片段，还能够提供更多的互作信息。然而，传统的Hi-C分析方法并不适用于Pore-C数据的评估。我们提出的新分析方法能够更好地利用Pore-C的长片段优势，显著提升有效数据率，并为研究人员提供更丰富的基因组互作信息。

‍

往期精彩：

干货指南｜Hi-C辅助组装的实验分析全攻略

干货指南｜Direct RNA测序m6A修饰结果一本通：结果解析，数据分析挖掘，实验验证

干货指南｜参考基因组选择指南

干货指南｜基因组Survey分析全攻略

干货指南｜什么！RNA质检又不合格！转录组测序取样建议

文献解读｜首个反刍动物绵羊T2T参考基因组发布

IF=150+ | 贝纳基因王牌产品T2T基因组项目文章合集

文章解读｜异源多倍体阿拉比卡咖啡的基因组和群体基因组揭示了现代咖啡品种的多样化历史

ONT测序质量值重大突破 | 中位值达Q28（准确性达到99.84%）

项目文章｜青岛百合首个完整线粒体基因组揭示了其独特的多染色体结构

Nature正刊！十二倍体甘蔗基因组发布！

武汉贝纳科技有限公司(下称"贝纳基因")成立于2012年，总部位于武汉高农生物园，是一家专注于Nanopore测序、二代测序和生物信息分析技术开发和应用的国家高新技术企业。核心团队拥有多年高通量测序、Nanopore测序和生物信息分析经验，在Nature和Science系列杂志发表多篇学术论文，博士、硕士学历员工占企业员工总数的72%。拥有自主测序平台（国内首批引进Nanopore PromethION平台）和专业的生物信息分析团队。

贝纳基因使用Nanopore平台完成全球第一个大型复杂植物基因组（菊花基因组）的组装和后续分析工作。提出并推动千种本草基因组计划，并构建药用植物基因组数据库，推动药材研究的发展。

贝纳基因使用Nanopore平台完成数千份细菌基因组、宏基因组测序和数据分析；完成数千份全长转录组和Direct转录组测序及分析。提出并推动基于Nanopore测序的万种微生物基因组完成图计划和十万人的Nanopore宏基因组研究计划。

贝纳基因开发了基于Nanopore平台的微生物检测体系，自主开发的数据库涵盖现已正式发表的所有微生物基因组，大型测序仪单机一次运行可以产生7.2T数据，小型便携式测序系统可用于临床检测和野外作业。

服务类型

网站：www.benagen.com

地址：武汉东湖新技术开发区高新大道888号高农生物园总部B区12C栋

电话：027-62435310

手机：15337161420

邮箱：service@benagen.com

贝纳课堂-Nanopore交流QQ群：992789813（本群已满）

贝纳课堂-Nanopore交流QQ群2：923119248

生物信息交流QQ群：198746977

客服QQ：3277498363

http://mp.weixin.qq.com/s?__biz=MzA3NDI2MzgzOQ==&mid=2650478402&idx=1&sn=76f3b4dc6be3abc5af3e0a6f8dd6fd13

贝纳基因

贝纳基因拥有Nanopore测序平台，专业提供基因组、转录组、宏基因组、重测序、蛋白组和代谢组等服务。贝纳基因愿景是“多场景测序应用方案引领者”。

最新文章

项目文章｜ONT全长转录组+简单验证，牦牛生长发育机制研究轻松拿捏高分文章

品质性状研究利器：植物多组学解决方案

文献解读｜高质量现代大豆品种泛基因组和重测序揭示重要性状结构变异

Pore-C数据评估新方法与新指标：揭开多维基因组互作的奥秘

干货指南｜Hi-C辅助组装的实验分析全攻略

文献解读｜单倍型基因组和重测序揭示现代月季起源和育种历史

文献解读｜首个棉花T2T参考基因组揭示着丝粒进化和折叠胚胎形成的分子调控与演化机制

项目文章｜蘑菇病原真菌的基因组测序揭示其致病机制

项目文章｜转录组学和代谢组学联合揭示微塑料胁迫对葡萄生长的影响机制

干货指南｜Direct RNA测序m6A修饰结果一本通：结果解析，数据分析挖掘，实验验证

一文畅谈，何为“泛”基因组——泛基因组的样本选择

Science重磅：首个人类剪接体结构图谱揭示RNA剪接调控未解之谜

NG项目文章｜基因组所周永锋团队建立葡萄全基因组选择育种体系

干货指南｜参考基因组选择指南

CGM第449期：SynDiv：基于群体基因组的染色体共线性分析工具

一次测序，同时检测4种RNA修饰，贝纳基因SAR20 Direct RNA 测序强势上线

Plant Communications 项目文章 | 辣椒“遵辣1号”T2T基因组揭示转座子驱动的近着丝粒区域扩张和进化

干货指南｜基因组Survey分析全攻略

文献解读｜学龄前儿童肠道菌群与行为学之间的特异性关联

ACS高分项目文章｜山东大学发表黏细菌5-甲基吡嗪酮的生物合成及生理功能研究

干货指南｜一文教会你轻松掌握可变剪切结果的解读与运用

项目文章 | T2T项目文章再添佳作！河南中医药大学和山东省林草种质资源中心分别发表鲁山冬凌草、玫瑰T2T基因组研究成果

扬帆起航，共创未来——香港启航基因科技有限公司开业庆典圆满落幕

文献解读｜最全面的猪基因组结构变异图谱

干货指南｜什么！RNA质检又不合格！转录组测序取样建议

NC解读｜ONT和PacBio全长转录组测序揭示阿尔茨海默病模型中内嗅皮层的差异性剪接

基因科技新地标｜香港启航基因科技盛大开业，共绘基因科技蓝图！

文献解读｜现存和灭绝的兔耳袋狸基因组，改善了澳大利亚特有的有袋动物的保护工作

文献解读｜首个反刍动物绵羊T2T参考基因组发布

Nature子刊项目文章｜氧气通过维持EGLN1催化的IRF3脯氨酸羟化来增强抗病毒的先天免疫

Nature子刊项目文章｜T2T基因组及多组学分析阐明月季茶香的生物合成和释放机制

CGM第442期：鸡产蛋量性状的分子调控机制

风华正茂，锦绣河山｜贝纳基因国庆小长假放假通知

国产纳米孔你知道哪些？重磅综述:全球纳米孔测序发展十周年

突破性研究｜首个植物Nanopore全长全谱—228个辣椒全长转录组数据库

贝纳基因ONT超精度测序SAR Q20系列产品——SAR20 ONT重测序

贝纳基因ONT超精度测序SAR Q20系列产品——SAR20 ONT超长测序

CGM第438期：亚基因组间的同源置换对芸薹属多倍体作物驯化的贡献

贝纳基因ONT超高精度长读长测序SAR Q27系列产品—— SAR20宏基因组

喜报 | ONT宏基因组三连发！

贝纳基因ONT超高精度长读长测序SAR Q27系列产品——SAR25扩增子16S/18S/ITS

会议邀请 | CGM方法技术专题第二期

ONT宏基因组项目文章Microbiome | 揭示微生物宏代谢的确定性动态规律：一项对厌氧生物降解的多组学研究

开学季产品介绍——TAIL Iso-seq

贝纳基因ONT超精度测序SAR Q20系列产品——SAR20 全长lncRNA测序

开学季产品介绍——Nanopore全长转录组

贝纳基因ONT超精度测序SAR Q20系列产品——SAR20 全长定量转录组

花好月圆人团圆｜贝纳基因中秋节放假通知

开学季产品介绍——全长lncRNA测序

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉