专题分享丨RNA-seq建库方案

学术   2024-08-21 18:02   浙江  

大家好,今天我将介绍RNA测序(RNA sequencing,RNA-seq)领域目前面临的主要瓶颈,并探讨为解决这些问题而进行的建库方法优化。这些优化不仅能克服现有技术的局限,还为未来的研究和临床应用提供了新的可能性。

一、背景

虽然基于游离DNA(Cell-free DNA,cfDNA)的检测方法,如基因突变、融合、拷贝数变化、甲基化和片段模式变化,已经在癌症检测与分类中展现了高特异性,但结合游离转录组信息可以进一步提高其在早期癌症诊断中的敏感性。已有多项研究表明,游离RNA(Cell-free RNA,cfRNA)在检测率和信息量方面比cfDNA更灵敏,且其具有功能性(反映动态变化、提供功能学信息)、敏感性(差异RNA表达、RNA转录后事件)、特异性(组织、肿瘤类型和亚型)等优势,是当下的研究热点,各种研究报道了多种cfRNA亚型。

cfRNA涵盖多种RNA分子,包括长链RNA,如信使RNA(mRNA)、长链非编码RNA(lncRNA)、环状RNA(circRNA),以及短链RNA,如微小RNA(miRNA)、PIWI结合RNA(piRNA)、终止子RNA(tsRNA)、核糖体RNA(rsRNA)。对于长度不超过400个核苷酸(nt)的非编码RNA,这些RNA被重新归类为小非编码RNA(sncRNA)。然而,血浆中的cfRNA主要由rRNA和线粒体RNA(mtRNA)组成,占测序转录本的约97%;相对而言,mRNA和miRNA在cfRNA中的比例较小(约2%),其中miRNA的含量更低(图1)

Larson, et al. Nat Commun 12, 2357 (2021).

图1 cfRNA表征分析

随着高通量测序技术的发展,RNA-seq已成为解析基因表达模式、研究疾病机制和发现生物标志物的重要工具。RNA-seq大大推动了功能性sncRNA的发现,越来越多的研究表明,小RNA通过多种机制调控生物体的生长发育和疾病发生。然而,血浆中其他类型的cfRNA的潜在价值仍然难以捉摸。在以往的研究中,cfRNA的表征主要集中在miRNA和mRNA上。目前,传统的总RNA建库方案已被证明对许多具有5’磷酸(5’-P)和3’羟基(3’-OH)的RNA有效(图2)。然而,这种直接连接接头的文库构建方法在RNA-seq和小RNA-seq中可能会在多个步骤中引入偏差,例如在长RNA片段化、逆转录、接头连接、聚合酶链反应(Polymerase Chain Reaction,PCR)文库扩增和测序等过程中。此外,当遇到带有特定RNA修饰的sncRNA时,这种方法固有的缺陷尤为突出。带有一种或多种修饰的sncRNA(如tsRNA、rsRNA等)通常被低效且不完全地转化为cDNA,从而给通过深度测序进行检测和定量带来了挑战。

图2常规总RNA建库方式

为了解决上述问题,目前已经有越来越多针对小RNA或总RNA的建库新方案。

二、小RNA建库方案优化

研究表明,在接头连接过程中,RNA连接酶会引入严重的偏差,这种偏差主要由目标连接处邻近的2-4个接头核苷酸引起。使用带有2-4个随机碱基的适配子可以显著减少这种偏差。因此,Nextflex Small RNA-Seq Kit通过采用带有随机核苷酸片段的接头,提高了接头连接的效率。该试剂盒的建库方案,通过使用一组在连接位点带有随机序列的接头,来纠正T4RNA连接酶1和T4 RNA连接酶2在RNA测序文库制备过程中产生的接头偏好。

具体而言,他们的建库方案首先使用截短的T4RNA连接酶(AlR Ligase)将预腺苷酸化的3’接头连接到小RNA上。随后,采用基于磁珠的纯化方法去除多余的接头。接着,使用T4 RNA连接酶1连接5’接头。在完成这些步骤后,使用与3’接头结合的引物进行反转录,然后使用与5’和3’接头序列结合的引物进行PCR扩增。PCR完成后,利用凝胶分离出所需的片段大小,最后进行测序(图3)

图3 Nextflex Small RNA-Seq Kit建库方案

Nextflex的建库方法将接头和RNA的末端更紧密地结合在一起来提高连接效率。然而,采用这些方法仍然具有明显的接头连接偏向性。例如,存在于特定RNA群体的3’末端核苷酸上的甲基化修饰的丰度因样品来源而异,这也降低了接头连接效率。RealSeq®-AC,在测序文库制备过程中,通过使用新颖的单一适配器和循环化,大大减少了文库制备的偏差。具体的他们将两个标准测序接头的序列合并到一个接头中,依靠连接一个单端的3’接头,然后进行环化。将该单个接头连接到miRNA的3’端,然后通过分子内连接将miRNA-接头连接产物环化。在miRNA-接头连接产物环化之前,将一种阻断寡核苷酸连接到剩余未连接接头的5’-腺苷酸化端,以抑制接头环化影响分子检测。对所得环进行反转录聚合酶链反应(Reverse Transcription Polymerase Chain Reaction,RT-PCR)扩增可生成适用于标准下一代平台的文库。通过这种方法,低效的分子间5’-接头连接步骤被高效的分子内连接所取代。与双接头方法相比,封闭和去除未连接的接头,然后进行分子内环化,可提高接头连接效率。并且该方案不使用凝胶纯化进行片段分选(分选直接不用去除接头),可实现文库间测序结果的更高重现性(图4)。

图4 RealSeq®-AC建库方案

文库构建过程中,PCR扩增也是产生偏倚的主要原因之一。由于PCR扩增具有一定的偏好性和错配率,理论上,不同的序列在PCR扩增过程中应该以相同的倍数扩增,但由于聚合酶的偏好性,经过多次扩增后,一些序列会持续扩增,而另一些序列则在达到一定程度后不再扩增。为了解决这一问题,QIAseq在反转录阶段引入了一段特异性的唯一分子标识符(Unique Molecular Identifier,UMI),从而在理论上实现了对低起始量样本的更准确定量分析。UMI可以准确鉴定低起始量样本的重复序列,该技术也是二代测序技术(Next-Generation Sequencin,NGS)数据分析过程中识别和校正PCR重复的有效工具(图5)。

图5 QIAseq建库方案

如前所述,RNA测序数据中的一个主要偏倚源于RNA在文库构建过程中的捕获方式。由于T4RNA连接酶对特定序列具有底物偏好,一些接头与RNA的组合比其他组合更容易被引入,从而导致小RNA测序文库中出现样本偏差。

前面提到的一种环化方案只需在一端进行接头连接,减少了由接头连接产生的偏倚。另一种替代接头连接的方法是对RNA的3’端进行腺苷酸化,使用聚腺苷酸聚合酶(poly(A) polymerase)在RNA的3’末端添加一段重复的核苷酸。与接头连接不同,RNA腺苷酸化是以序列无关的方式进行的。虽然RNA的3’腺苷酸化已被报道可用于生成小RNA测序文库,但这一方法仍需在RNA的5’末端进行连接,因此仍然容易受到序列特异性偏倚的影响。

为解决这一问题Illumina开发了一种针对小RNA的建库试剂盒--SMARTer smRNA-Seq kit,该试剂盒不需要接头连接即可构建测序文库。该建库流程结合RNA 3’腺苷酸化和RNA模板5’端的开关机制技术(SMART,Switching Mechanism At 5’end of the RNA Transcript),以无连接的方式生成测序文库。与将接头连接到RNA上不同,这种方法在第一链合成过程中在生成cDNA的两端引入接头。在输入RNA进行腺苷酸化后,第一链cDNA合成由dT引物(3’ smRNA dT Primer)引发,由MMLV衍生的PrimeScript逆转录酶进行逆转录,该酶在到达每个RNA模板的5’末端时添加非模板的核苷酸。SMART smRNA oligo随后与这些非模板核苷酸配对,并作为反转录在第一链cDNA中加入额外核苷酸序列的模板。每个cDNA分子的5’和3’末端的序列作为PCR的引物结合位点,PCR扩增过程中使用的引物包含Illumina兼容的接头和索引。

图6 SMARTer smRNA-Seq kit建库方案

二、总RNA建库方案优化

Illumina针对总RNA的建库试剂盒也开发了一种建库试剂盒。SMARTer Stranded Total RNA-Seq Kit。该建库方案采用随机引物,能够降低3'端接头连接的偏好性。类似于小RNA建库试剂盒中使用的SMART技术,该技术同步进行逆转录与接头连接,不仅减少了接头连接的偏差,还节省了时间,并确保了cDNA的全长和高质量合成。此外,它还创新性的引入了ZapR Rprobes探针加酶法的核糖体去除技术,可实现在建库过程中识别、切断核糖体来源的cDNA,而无需前处理rRNA,最终可在6h内完成链特异性Illumina文库的构建。

图7 SMARTer Stranded Total RNA-Seq Kit建库方案

此外,NEB Small RNA试剂盒不仅可以针对小RNA,也可以针对总RNA进行建库。其建库流程首先在3’端连接接头,然后进行引物杂交,使接头和引物形成双链结构。这种接头连接方式优势在于当进行5’端接头连接时,能够有效避免双链和单链之间的连接,从而在保证高产量和高质量文库的同时,最大限度地减少接头二聚体的形成。

图8NEBNext® Small RNA建库方案

最后介绍的一种建库方式是今年1月发表在《Nature Communications》的研究论文,题为“Terminal modifications independent cell-free RNA sequencing enables sensitive early cancer detection and classification”。在这篇文章中,作者主要介绍了一种利用该团队先前的研究成果Direct S-Poly(T)Plus基于荧光定量PCR的小分子RNA定量检测技术,加以改良优化从而诞生的一种新的血浆cfRNA文库制备技术,名为SLiPiR-seq,该技术具有不依赖RNA末端修饰的优势,因此即使只用微量血浆(100μL)也依然能得到准确可靠的检测结果在揭示血浆转录本与病理机制的关联等研究中具有很好的前景。

SLiPiR-seq建库方案中,设计了一个自定义合成的RT引物,包含了oligo(dT)序列、样本条形码和测序接头序列。样本条形码由一段兼并碱基组成,确保能够逆转录所有类型的RNA。该方案在3’末端进行多腺苷酸化和逆转录同步处理,避免了直接在3’端添加接头,从而减少了接头连接的偏移,提高了文库构建的效率。在5’端接头连接过程中,采用“夹板连接”技术和双接头设计,确保RNA与接头形成有利于连接的二级结构,并降低了接头连接的偏好性。经过“夹板”处理的3’端接头可直接作为引物启动cDNA合成。两步接头添加过程都经过优化,以避免接头连接偏倚。同时,通过酶法去除多余接头,减少了接头引物二聚体的形成,从而避免了对信息读取比例和RNA检测量的显著影响。

此外,SLiPiR-seq协议进行了进一步优化,使整个工作流程可以在一个管中完成,从而降低了在建库过程中DNA和RNA的损失。这种优化使得SLiPiR-seq成为一种灵敏的文库制备方法,能够有效处理低丰度、高度片段化的RNA,并且在检测cfRNA物种方面优于适配器连接法。该技术不依赖于RNA末端修饰,允许独立于cfRNA的5’端磷酸化进行分析。因此,即使使用微量血浆(SLiPiR-seq结果的血浆输入下限为100μL,显著低于大多数市售小RNA文库制备试剂盒的最低要求),也能获得准确可靠的检测结果,具有在揭示血浆转录本与病理机制关联等研究中的良好前景。

图9 SLiPiR-seq建库方案

越来越多的研究通过改进建库技术提升RNA-seq的敏感性和准确性。这些优化不仅推动了基础研究的发展,也有助于早期癌症检测和分类的精确性。在未来的研究中,这些进展将为我们提供更多的可能性,推动相关领域的不断突破。

微信号:HanDa-Lab
课题组网站:https://www.hanlab.net/

撰稿:宿星蕾

校对:韩达

编辑:侯佳宁

∨ 点击“阅读原文”直达文献

韩达课题组
韩达课题组
 最新文章