点击蓝字关注我们
01
项目文章一|鲁山冬凌草高质量T2T基因组组装揭示了两种冬凌草的基因组结构差异
英文标题:High-quality assembly of the T2T genome for Isodon rubescens f. lushanensis reveals genomic structure variations between 2 typical forms of Isodon rubescens
发表时间:2024.10.10
发表期刊:GigaScience
影响因子:11.8
近日,河南中医药大学中医药资源和化学重点实验室团队在国际著名期刊《GigaScience》在线发表题为High-quality assembly of the T2T genome for Isodon rubescens f. lushanensis reveals genomic structure variations between 2 typical forms of Isodon rubescens的文章。河南中医药大学博士研究生杨灏、河南中医药大学仲景青年学者练丛龙、本科生刘金璐为论文的共同第一作者,河南中医药大学陈随清教授、浙江大学叶丽丹教授为论文的通讯作者。
该研究团队发现了冬凌草(Isodon rubescens (Hemsl.))的另一个变型鲁山冬凌草(Isodon rubescens f. lushanensis),研究团队使用PB HiFi测序(30.55 Gb,87.54 X)+ONT 50K超长测序(19.37 Gb,55.5 X)+Hi-C(89.15 Gb,255.44 X)测序,通过混合组装策略,组装得到大小为349 Mb,Contig N50为28.8 Mb的鲁山冬凌草T2T水平参考基因组。比较了鲁山冬凌草和冬凌草基因组二萜类物质合成途径中的独特基因与二萜类物质合成基因中的SVs,为了解冬凌草的活性物质化学结构差异提供了分子证据。
贝纳基因参与了本研究Oxford Nanopore 超长测序、PacBio HiFi测序、Hi-C测序、基因组组装注释及部分分析工作。
研究背景
冬凌草属于唇形科(Labiatae),香茶菜属(Isodon),是一种重要的药用植物,大多数香茶菜属植物富含酮基环烷二萜,具有α-亚甲基环戊酮结构和较强的抗癌活性。其中,冬凌草素(oridonin)是冬凌草独特的代表性活性成分之一,具有良好的抗癌和抗肿瘤活性,副作用少,能够减少化疗药物引起的不良反应,具有极高的研究价值。而鲁山冬凌草作为冬凌草的变型,也存在结构类似的二萜类物质鲁山冬凌草素(lushanrubescensin),冬凌草二萜生物合成途径与活性物质化学结构变异具有极高的研究价值。
主要研究结果
一、鲁山冬凌草T2T基因组组装注释
研究团队使用PB HiFi测序(30.55 Gb,87.54 X)+ONT 50K超长测序(19.37 Gb,55.5 X)+Hi-C测序(89.15 Gb,255.44 X),组装得到了鲁山冬凌草T2T参考基因组(I. rubescens-LS),基因组大小为349 MB,杂合度为1.7%,BUSCO为94.4%,Contig N50 28.8Mb,GC含量35.95%,重复序列比例58.47%。在鲁山冬凌草中注释得到34865个蛋白编码基因,mRNA的平均长度为4110.25bp。基因组中主要重复序列类型为LTRs,所占比例为28.98%。
鲁山冬凌草基因组组装circos图
二、同源基因家族分析
在基因家族分析中,研究团队使用Orthofinder 对所选物种的所有氨基酸序列进行聚类,在所有物种中发现了55076个同源基因家族,包括465541个基因,其中单拷贝基因有158个,所有物种共有的基因家族有4119个,包括151827个基因。值得注意的是,在两种冬凌草基因组之间共享的基因家族占其基因组中总基因家族的75%,并且大部分基因都较为保守,这种关系表明两种冬凌草在亲缘关系上极为近缘。通过筛选两种冬凌草特有的基因家族,并对基因进行功能注释,研究团队得到14个基因,其富集功能在二萜合成途径中。研究团队猜测两种冬凌草基因组之间的二萜合成基因的变异,可能导致了两种冬凌草的活性成分产生化学结构上的变异。
两种冬凌草特有基因家族聚类结果图
三、系统发育和全基因组复制事件分析
在基因家族分析中,为了确定两种冬凌草的亲缘关系和演化历程,研究团队进行了系统发育分析,结果显示唇形科的7个物种被聚类为单系,冬凌草与紫苏在进化树上亲缘关系最近,这与之前对唇形科的系统发育研究结果一致。使用CAFE进行基因家族收缩扩张分析,结果显示相对于它们的最近共同祖先节点(MRCA),鲁山冬凌草和冬凌草基因家族的收缩数分别为567个和1963个,扩增基因家族分别为616个和897个。这些数量相对低于其他大多数唇形科植物,表明冬凌草比其他唇形科植物更保守。WGD分析发现,鲁山冬凌草和冬凌草的Ks曲线峰值和分离曲线的峰值重合,结合系统发育和分化时间分析的结果,研究团队推测,鲁山冬凌草和冬凌草之间发生了全基因组复制事件,从而导致了两种形态的进化分化。
两种冬凌草与近缘物种中基因家族收缩扩张分析
冬凌草全基因组复制事件分析
四、结构变异对二萜合成基因的影响
为了研究鲁山冬凌草和冬凌草基因组SV对二萜类活性物质合成的影响,研究团队对鲁山冬凌草和冬凌草基因组进行共线性比对,对全基因组范围基因组PAVs和SVs进行分析。SVs共鉴定得到56399个,主要分布在基因间区。主要类型为重复突变,占53.7%。PAVs 共鉴定得到34443个,存在和缺失突变的数量几乎相同,突变的长度从1bp到450Kb不等。
研究团队对受PAVs和SVs影响的、属于二萜合成途径中富集的基因进行注释,并进行染色体定位。结果显示,35个基因分布在8条染色体上,其中大部分为二萜合成酶基因,以及一个CYP450编码基因和5个赤霉素合成途径的基因。这一结果支持了二萜合成相关基因的变异可能是冬凌草活性物质化学结构变异的驱动力之一的推测。
两种冬凌草全基因组范围SV分析
总结
本研究首次组装了鲁山冬凌草T2T水平参考基因组,揭示了其与冬凌草之间演化关系和基因组结构差异。研究发现在鲁山冬凌草和冬凌草基因组之间,存在大量SVs和特有基因与二萜类物质合成相关。这项研究为了解冬凌草的活性物质化学结构差异提供了分子证据。
02
项目文章二 | 玫瑰T2T基因组为调控花青素生物合成提供见解
英文标题:Telomere-to-telomere, gap-free assembly of the Rosa rugosa reference genome
发表时间:2024.09.20
发表期刊:Horticultural Plant Journal
影响因子:5.7
2024年9月《Horticultural Plant Journal》杂志在线发表了题为Telomere-to-telomere, gap-free assembly of the Rosa rugosa reference genome的研究成果,山东省林草种质资源中心为第一单位,刘丹研究员、刘鵾高级工程师、仝伯强研究员为论文的共同第一作者,解孝满研究员、贾凯华助理研究员、王龙欣讲师为该文的通讯作者。该研究首次测序、组装和注释了野生玫瑰(Rosa rugosa)的端粒到端粒(T2T)参考基因组,鉴定了基因组上的rDNA、端粒及着丝粒序列,为野生玫瑰种质资源的遗传评价和种质创新奠定坚实基础,也为野生玫瑰的遗传学和育种学提供了重要资源。
贝纳基因参与了本研究的PacBio HiFi、Nanopore ultra-long、Hi-C、二代等所有测序工作。
研究背景
蔷薇属植物是世界上最受欢迎和栽培最广泛的观赏植物之一。野生玫瑰(Rosa rugosa)是国家重点保护野生植物,隶属于蔷薇科蔷薇属。蔷薇属植物经历了广泛的网状进化,包括多倍体化、不同种之间的杂交和渐渗,这给基因组的组装带来了挑战。先前发布的玫瑰基因组序列不完整,存在未解决的间隙和未挂载到染色体上的区域,从而阻碍了玫瑰的功能基因组学和遗传改良的研究。
主要研究结果
一、野生玫瑰T2T基因组组装注释
本研究通过前期的基因组调查和流式细胞实验,估计野生玫瑰基因组大小为445.67 Mb,杂合度为0.78%。T2T组装所使用的测序数据包括42 Gb PacBio HiFi测序、20 Gb Nanopore ultra-long超长测序(N50 100 Kb)、136 Gb Hi-C测序以及94 Gb二代测序数据。最终组装的基因组大小为444.55 Mb,Contig N50为61.29 Mb,重复序列占比为51.55%,含有34,109个蛋白质编码基因。基于组装后的基因组,研究团队成功鉴定了14个端粒、7个着丝粒、3个5S rDNA基因簇和1个18-5.8-28S rDNA基因簇,实现了全部7条 T2T 染色体,形成了第一个无间隙的R. rugosa T2T 基因组。
图 1 野生玫瑰(Rosa rugosa)基因组特征
二、系统进化树构建和SV鉴定
本研究以葡萄作为外群,通过单拷贝直系同源基因构建了包括玫瑰和月季在内的系统进化树。研究团队推断玫瑰和月季的共同祖先在3370万年前与其他物种发生分化,而玫瑰和月季发生分化的时间在550万年前。通过共线性分析和Ks分析,发现玫瑰在核心双子叶γ事件后未发生过基因组复制事件,同时,观察到玫瑰和R. chinensis基因组与其他蔷薇科基因组存在大片段染色体易位。结构变异被认为是遗传多样性和适应性进化的重要驱动力,以月季作为参考基因组,在玫瑰中鉴定到了3659个结构变异,包括93个倒位、975个重复和2589个易位。
图 2 玫瑰的进化历史
三、玫瑰特异LTR-RTs鉴定及插入时间分析
以月季作为参考基因组,研究团队在玫瑰中鉴定了4614个特异的长末端重复反转录转座子(LTR-RTs),其中Copia(2963个)为主。这些Copia下游调控的基因主要富集在蛋白偶联受体信号等通路上。鉴定的这些LTR-RTs是在近650万年内插入的,与玫瑰和月季的分化时间相吻合。
图 3 玫瑰物种特异的LTR-RTs鉴定与插入时间分析
四、玫瑰花青素的动态调节
研究团队在玫瑰基因组中注释了137个参与花青素合成途径的酶基因,其中37个为串联重复基因。根据三种不同花瓣颜色的转录组数据显示,这些酶基因中的89个在三种颜色中均有表达,红色花瓣中的高表达基因数量最多。通过加权基因共表达网络分析(WGCNA),发现蓝绿色模块有33个酶基因,蓝色模块有30个酶基因,与花青素合成途径相关的基因在这两个模块中显著富集。通过构建多层分级的基因调控网络,发现位于顶层和中层的共45个转录因子调控着底层的28个花青素生物合成基因的表达,这一全面的基因调控网络为花青素生物合成的转录控制提供了有价值的见解。
图 4 花青素合成通路的基因注释和调控网络
总结
本研究首次构建了一个高质量的、无间隙、端粒到端粒(T2T)的玫瑰参考基因组,并鉴定了基因组上的rDNA、端粒和着丝粒序列,以及叶绿体和线粒体基因组,还通过转录组预测了可能调控花青素生物合成的转录因子,这些结果可以促进对玫瑰基因组结构和功能的深入研究,对推动玫瑰育种和遗传改良具有重要意义。
参考文献:
Yang, Hao et al. “High-quality assembly of the T2T genome for Isodon rubescens f. lushanensis reveals genomic structure variations between 2 typical forms of Isodon rubescens.” GigaScience vol. 13 (2024): giae075.
Dan Liu, et al. " Telomere-to-telomere, gap-free assembly of the Rosa rugosa reference genome." Horticultural Plant Journal (2024): 1-38.
文献链接:
https://academic.oup.com/gigascience/article/doi/10.1093/gigascience/giae075/7817745
https://www.sciencedirect.com/science/article/pii/S2468014124001584
点击文末阅读原文,获取文献链接
往期精彩:
NAR解读|Direct RNA测序揭示U6 snRNA m6A 修饰在mRNA准确剪接中的关键作用
NC文献解读| Direct RNA测序能够消除传统抗体方法检测m6A修饰的假阳性问题
文献解读|小鼠肝脏对反复毒性损伤的耐受性与脂肪变性和炎症有关
Plant Cell文献解读 | 稻瘟病菌侵染植物的转录组景观揭示了时间共调控和结构保守的效应因子家族
文献解读 | The Plant Cell期刊发表十字花科植物基因间区长链非编码RNA的鉴定与功能注释成果
项目文章 | 纳米孔长读长RNA测序揭示人类血管平滑肌细胞中功能性的可变剪接变体
m7GHub V2.0:一个用于解析表观转录组m7G甲基化修饰的数据库
项目文章|贝纳基因Direct RNA测序助力牛脂肪细胞成脂机制研究
贝纳基因使用Nanopore平台完成全球第一个大型复杂植物基因组(菊花基因组)的组装和后续分析工作。提出并推动千种本草基因组计划,并构建药用植物基因组数据库,推动药材研究的发展。
贝纳基因使用Nanopore平台完成数千份细菌基因组、宏基因组测序和数据分析;完成数千份全长转录组和Direct转录组测序及分析。提出并推动基于Nanopore测序的万种微生物基因组完成图计划和十万人的Nanopore宏基因组研究计划。
贝纳基因开发了基于Nanopore平台的微生物检测体系,自主开发的数据库涵盖现已正式发表的所有微生物基因组,大型测序仪单机一次运行可以产生7.2T数据,小型便携式测序系统可用于临床检测和野外作业。
贝纳课堂-Nanopore交流QQ群:992789813(本群已满)
贝纳课堂-Nanopore交流QQ群2:923119248
生物信息交流QQ群:198746977
客服QQ:3277498363