2024年诺贝尔生理学或医学奖于北京时间10月7日下午5点30分公布,授予发现 microRNA 的两名科学家Victor Ambros、Gary Ruvkun,
这篇文章是2020年左右写的,请辩证的来看~
microRNA属于转录组RNAseq的一个小方向,如图,
转录组测序简介
「转录组」(Transcriptome)是组织中单个或一组细胞某个状态下DNA转录出的所有RNA集合,所有RNA可分为「编码RNA」(mRNA)和「非编码RNA」(miRNA , piRNA, SiRNA, SnRNA,lncRNA, NAT, eRNA, circ RNA, ceRNAs等等),下图清晰展示RNA家族分类(「红圈标记处是本文想要重点介绍的部分」)。 一般所说的「转录组测序」仅指mRNA测序,实际研究中转录组测序按目的不同还会细分,如mRNA测序(Messenger RNAs)、miRNA测序(microRNAs,small RNA中研究的最多的的一种)、lncRNA测序(Long noncoding RNAs)、circRNA测序(Circular RNAs)、【单细胞转录组、空间转录组、三代测序的全长转录组、无比对参考基因组的无参转录组、物种进化相关的比较转录组与泛转录组测序、特定环境的宏转录组等等】; 按照「测序策略」差异可将转录组测序分为short-read cDNA (测短的cDNA)、 long-read cDNA(测长cDNA)、long-read RNA(直接测RNA),比较如下: ❝
short-read cDNA,高通量,擅长研究「基因差异表达」;
❞
long-read cDNA,长读长,擅长「新异构体」发现、「新转录本」发现、「新基因融合」转录本发现等;
long-read RNA,长读长,擅长新异构体发现、新转录本发现、新基因融合转录本发现、研究「转录本修饰」信息。
三者详细比较如下「转录组测序运用」主要在以下方面:
❝❞
基因差异表达(differential gene expression) mRNA差异剪接(differential splicing of mRNAs) 单细胞基因表达(single-cell gene expression) RNA蛋白互作(the translatome) RNA结构(the structurome) 转录异质性(spatialomics)
mRNA|miRNA|lncRNA|circRNA分析简介
介绍各组学在转录调控中的作用机制,生信分析流程。
mRNA组
mRNA组就是测某个条件下上图中的mature mRNA,从上图可看出mRNA有一个Poly-A tail,mRNA测序文库构建时,利用「oligo(dT)磁珠能特异结合Poly-A tail」的原理,特异地将mRNA从总RNA中分离出来实现富集。「mRNA生信分析重点关注」case组和control组之间差异表达基因,也会做基因与蛋白互作、新转录本预测、可变剪切、基因融合等方面分析,下图可参考:
miRNA组
「miRNA作用机制」主要是沉默mRNA以实现「调控基因表达」,植物和动物中作用机制不一样,上图为植物中miRNA的作用机制(剪切以降解mRNA或者抑制翻译)。 「miRNA建库方式」有别于其它组学,主要是利用其长度分布在20 nt左右,文库构建时「切胶回收」该范围的条带,条带中还包含rRNA,siRNA,piRNA,tRNA等非编码RNA,所有后续分析会使用Rfame数据库,miRBASE来剔除非miRNA。 「miRNA生信分析重点关注」case组和control组之间差异表达miRNA,差异表达miRNA的靶mRNA预测,也会功能分析,下图可参考:
会用到的一些关键数据库及软件如下
lncRNA组
lncRNA(Long non-coding RNAs)指大于200nt的非编码RNA,能够与 DNA, RNA甚至蛋白作用。 l「ncRNA作用机制」可区分如下图几大类,
lncRNA测序建库时,会用试剂盒去除total RNA中的rRNA(所以lncRNA文库中也会有mRNA,生信分析也会附带分析mRNA)。 lncRNA「生信分析重点关注」case组和control组之间lncRNA差异表达,lncRNA顺/反式靶基因预测,其它还会分析miRNA、lncRNA与其靶基因mRNA的关联分析,下图简介分析流程。
circRNA组
circRNA合成及作用机制如下图。
circRNA生信分析
参考
mRNA|miRNA|lncRNA|circRNA关联分析
根据mRNA、miRNA、lncRNA、circRNA之间的相互作用可进行关联分析,以深入研究转录调控机制,下图为各种编码和非编码RNA之间的相互作用机制。关联分析差不多是这个意思
Reference
❝❞
Gomes C P D C , Schroen B , Kuster G M , et al. Regulatory RNAs in Heart Failure[J]. Circulation, 2020, 141(4):313-328. Stark R , Grzelak M , Hadfield J . RNA sequencing: the teenage years[J]. Nature Reviews Genetics. https://en.wikipedia.org/wiki/File:Gene_structure_eukaryote_2_annotated.svg Conesa A , Madrigal P , Tarazona S , et al. A survey of best practices for RNA-seq data analysis[J]. Genome Biology, 2016, 17(1):181. Hrdlickova B , De Almeida R C , Borek Z , et al. Genetic variation in the non-coding genome: Involvement of micro-RNAs and long non-coding RNAs in disease.[J]. BBA - Molecular Basis of Disease, 2014, 1842(10):1910-1922. https://sysbiocube-abcc.ncifcrf.gov/public/sysbiocube_documents/sysbiocube_sops/miRNAseq.pdf https://www.researchgate.net/figure/Overview-of-the-wheat-miRNA-pipeline-The-procedure-is-divided-in-three-parts-producing_fig5_275360044 https://www.g3journal.org/content/9/4/1263 【科研】LncRNA的数据分析 Gao Y , Li S , Lai Z , et al. Analysis of Long Non-Coding RNA and mRNA Expression Profiling in Immature and Mature Bovine (Bos taurus) Testes[J]. Frontiers in Genetics, 2013, 10. https://www.futuremedicine.com/doi/pdf/10.2217/epi-2019-0295
-END- 分享一份Python可视化教程(基于py可视化利器seaborn):530张图形+8000行代码+详细代码注释+后续免费更新+学习交流群,教程部分内容, 例如,
👉可视化配色工具,colormap多达3174类,数万种颜色!
每类图表包含详细代码+详细代码注释,多达8000行代码,例如,
如何加入学习?
👇加入学习(收费、备注:169)
✅解锁获取6大权限:
8000+行代码(复制即可运行) 在线教程文档(清晰目录) 依赖数据(免费下载) 交流群 后续更新 定期抽最新机器学习、数据科学类书籍 点个 在看、赞 就是最大的支持