今天学习一下关于Cas13蛋白的crRNA设计问题,是来自洛克菲勒大学Marraffini团队发表在MC上的一篇工作。Marraffini教授也是CRISPR领域的牛人,曾经早在2008年发表了一篇Science工作,证明了Type III-A的CRISPR系统靶向的是DNA序列,而不是RNA序列。Marraffini教授和张锋教授合作也比较多,也参与了张锋教授那篇Science成名作,是共同作者。
之所以选择这篇工作,是因为这篇工作的重要性。这篇文章解决了Cas13蛋白crRNA的设计中常碰到的一个问题,即如何选择高效的target序列(即protospacer序列,与crRNA的spacer序列互补配对)?
原文的数据比较多,实验对照非常详细,感兴趣的同学可以下载原文认真读一下。我这里就不一一解读原图了,直接来说下结论(Graphical Abstract中也能看的比较清楚)。
作者把crRNA茎环3’端8nt的DR区称为tag序列,与spacer序列相连。研究发现当target RNA含有anti-tag序列时,protospacer及anti-tag序列会与crRNA的spacer及tag序列以碱基互补配对的反式形成dsRNA结构,这种结构会将Cas13a锁定(LOCK)在被抑制的状态,这种抑制包括体内和体外,也包括cis和trans切割活性。而且,Cas13a在这种LOCK失活的状态下是无法被高浓度target RNA激活的。
这里,作者也解释了Cas13 anti-tag的进化意义,即可以防止CRISPR自切割。这个解释感觉上还是很有道理的。
这篇文章的工作对于我们设计Cas13 crRNA spacer序列时很有帮助。我们之前只知道关注target RNA的PFS序列,这篇MC则告诉我们其实应该关注anti-tag序列。
这里作者提到了对于LshCas13a来说,选择用PFS而不是PAM来定义3' protospacer序列,提到了PFS不能是G。当然,这里选择用PFS的原因,现在看来不一定成立,因为Marraffini的这篇文章中明确提出了anti-tag的意义可能在于区分自我和非我序列,和PAM其实是一致的。不过,名称不是最关键的,我们接着往下看。
在原文Figure 2中,作者做了PFS scanning的工作,其中发现当PFS位G时,Cas13的切割效率不高,而为C/A时普遍较高,U也还行。其实,这里仔细分析后,我们就能发现,有几个靶点,如26和28,刚好就满足了部分anti-tag序列的特征,都是GUUU序列。其他几个PFS=G的序列,虽然不能和tag形成完美的dsRNA,但是也是起到了anti-tag的作用?还是说有些序列的效率就是低,跟PFS没关系,因为在以C/A/U为PFS序列的情况下,各个crRNA的切割效率也是差异比较大的。那么,是否在张锋教授早期的实验数据中,其实就已经提示了anti-tag序列的存在?只是当时没意识到?欢迎大家整理更多的数据来一起讨论分析。
(2)第二篇是来自Jennifer Doudna团队同样于2016年发表于Nature的一篇工作。虽然这篇工作比张锋的那篇Science稍微几个月,不过这篇工作中倒是证明了Cas13具有trans-cleavage/collateral cleavage的活性。当然,该活性到底是谁先发现的,也不能完全看文章,也还得要去扒她们团队和张锋团队的专利申请时间和内容,以后有空再找资料分析吧。
在这篇Nature文章中,作者用LbuCas13a进行了PFS分析,最后发现该蛋白没有显著的PFS选择性,G/C/A/U都能切割的很好,这点应该是和这篇MC的结论是吻合的。
当然,后来杨辉教授团队鉴定了Cas13X.1后,发现Cas13X.1蛋白也没有显著的PFS序列选择性(下图)。
所以,综合分析,推测Cas13的PFS单点序列的影响比较小,而受anti-tag影响的可能性比较大。在张锋的那篇Science中,很可能也是个一个巧合?即在PFS=G的序列中,有几条不仅满足了G的要求,也满足了anti-tag的条件,剩余的可能就是spacer序列本身的效率就比较低,可能换啥PFS都效率低?
2. 感觉上这个anti-tag的发现可以用于multiplexed diagnostics诊断体系的设计。欢迎大家来一起思考,一起交流,我们找个时间再来一起讨论这个可能性。
参考文献:
[1] Meeske AJ, Marraffini LA. RNA Guide Complementarity Prevents Self-Targeting in Type VI CRISPR Systems. Mol Cell. 2018 Sep 6;71(5):791-801.e3. doi: 10.1016/j.molcel.2018.07.013. Epub 2018 Aug 16. PMID: 30122537; PMCID: PMC7955661.
[2] Abudayyeh OO, Gootenberg JS, Konermann S, Joung J, Slaymaker IM, Cox DB, Shmakov S, Makarova KS, Semenova E, Minakhin L, Severinov K, Regev A, Lander ES, Koonin EV, Zhang F. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science. 2016 Aug 5;353(6299):aaf5573. doi: 10.1126/science.aaf5573. Epub 2016 Jun 2. PMID: 27256883; PMCID: PMC5127784.\
[3] East-Seletsky A, O'Connell MR, Knight SC, Burstein D, Cate JH, Tjian R, Doudna JA. Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection. Nature. 2016 Oct 13;538(7624):270-273. doi: 10.1038/nature19802. Epub 2016 Sep 26. PMID: 27669025; PMCID: PMC5576363.
[4] Xu C, Zhou Y, Xiao Q, He B, Geng G, Wang Z, Cao B, Dong X, Bai W, Wang Y, Wang X, Zhou D, Yuan T, Huo X, Lai J, Yang H. Programmable RNA editing with compact CRISPR-Cas13 systems from uncultivated microbes. Nat Methods. 2021 May;18(5):499-506. doi: 10.1038/s41592-021-01124-4. Epub 2021 May 3. Erratum in: Nat Methods. 2022 Feb;19(2):255. doi: 10.1038/s41592-021-01379-x. PMID: 33941935.