强抗寒甘蓝型冬油菜基因组组装和基因组特征解析
研究论文
● 原文链接DOI: https://doi.org/10.1002/imo2.32
● 2024年9月28日,甘肃农业大学-省部共建干旱生境作物学国家重点实验室武泽峰、刘自刚等在iMetaOmics在线发表了题为“Genome assembly and genomic architecture of a prominent cold-resistant rapeseed germplasm”的文章。
● 本研究结合二代、三代以及Hi-C测序技术对甘肃农业大学油菜遗传育种团队独立培育出的强抗寒甘蓝型冬油菜NTS57栽培品种进行了基因组测序和从头组装,获得了高质量的参考基因组;同时结合已发表的甘蓝型冬油菜进行了泛基因组水平的研究,揭示了NTS57基因组独特性;最后对NTS57在低温胁迫下的转录组和甲基化动态变化进行了分析,挖掘到了大量抗寒基因和相关代谢通路,同时也揭示出DNA去甲基化对于低温胁迫应答至关重要。总之,本研究为理解冬油菜的抗寒分子机制提供了重要参考。
● 第一作者:武泽峰
● 通讯作者:刘自刚(lzgworking@163.com)
● 合作作者:郑国强、孙亚丽、董小云、王莹、李辉、魏家萍、崔俊美、方彦、牛伊宁、黄镇、胡继宏
● 主要单位:甘肃农业大学省部共建干旱生境作物学国家重点实验室、西北农林科技大学农学院
● 强抗寒冬油菜NTS57高质量参考基因组组装;
● 冬油菜泛基因组分析揭示NTS57基因组结构变异与抗寒性关系;
● 多组学分析挖掘NTS57抗寒基因及其相关代谢通路。
低温胁迫是限制作物正常生长和发育的重要因素之一。冬油菜是一种重要的油料作物,在高纬度地区经常受到低温胁迫,从而导致减产。因此,培育高抗寒冬油菜品种并阐明其基因组结构特征对于抗寒性状的遗传改良至关重要。为此,本研通过整合Illumina、PacBio和Hi-C测序技术,从头组装了强抗寒冬油菜栽培品种NTS57染色体级别的高质量参考基因组。通过系统发育和比较基因组分析,确定了NTS57与其他油菜品种之间的系统发生关系;通过整合其他已公布的甘蓝型油菜品种,在泛基因组水平揭示了NTS57与其他油菜品种之间的结构变异;对NTS57低温胁迫下的行转录组进行分析,鉴定了低温响应基因和相关代谢通路;最后对低温胁迫下DNA甲基化水平进行了分析,揭示出DNA去甲基化对于冬油菜低温胁迫应答是必需的。总之,本研究对于理解油菜抗寒性提供了一定的参考。
Bilibili:https://www.bilibili.com/video/BV1hmyNYHEzx/
Youtube:https://youtu.be/bQOYuCxt-oo
中文翻译、PPT、中/英文视频解读等扩展资料下载
请访问期刊官网:http://www.imeta.science/
引 言
冬油菜是一种重要的油料作物,种植在高纬度地区的冬油菜经常受到低温胁迫的影响,然而目前对于冬油菜,特别是高抗寒冬油菜的遗传解析没有系统的报道。本研究通过整合Illumina、PacBio和Hi-C测序数据,从头组装了抗寒性强抗寒性冬油菜栽培品种NTS57的染色体组水平参考基因组。通过系统发育和比较基因组分析,揭示了NTS57与其他油菜品种之间的系统发生关系和基因组结构变异。对 NTS57 和冷胁迫下的冷敏感栽培品种进行转录组分析,发现了超过 10,000 个差异表达基因,这些基因富集于昼夜节律、光合作用和冷响应调控等生物学过程中。此外,这些差异表达基因涵盖了经典的植物冷应答信号通路中的许多重要基因组分,包括 DREBs、ZAT12、CAMTA3/5 和 CORs。重要的是,相对于冷敏感栽培油菜品种,与细胞微管发育相关的基因或生物通路在 NTS57 的低温胁迫下种更为活跃,这很可能与其强抗寒性有关。我们还发现,甲基化水平在冷胁迫下显著降低,这表明去甲基化对于油菜冷胁迫反应是必需的。
结果和讨论
强抗寒冬油菜的基因组组装和注释
甘蓝型冬油菜NTS57(Brassica napus, 2n = 38,AACC)是由甘蓝型冬油菜与白菜型冬油菜远缘杂交而成的栽培品种。它具有很强的抗寒性,能够在我国西北地区-26°C低温环境下顺利越冬。为了探索NTS57抗寒性的遗传机制,我们通过整合60×PacBio(HiFi)长读长测序、100×Hi-C测序和30×Illumina双端测序数据,对NTS57基因组进行了DNA测序和从头组装。首先,对Illumina测序数据进行K-mer分析,估计NTS57的基因组大小为1.01-1.29 Gb(图S1)。然后,将PacBio测序数据组装并打磨形成一个1.06 Gb的基因组,组装的contig N50为21.81 Mb,最后经过Hi-C染色体挂载后,超过 93.6% (995 Mb)的序列被锚定在19条染色体上,Scaffold N50为58.64 Mb (图1A, B)。基于该高质量的参考基因组,我们在19 条染色体上均成功鉴定到了着丝粒序列(图 1B 和表 S1)。此外,BUSCO得分高达 99.75%,证明了基因组组装的高度完整性。通过比较发现,本研究组装的参考基因组质量明显优于已发表的其他甘蓝型油菜的参考基因组(表 S2)。基于ab initio预测、同源性搜索和转录组三种策略在NTS57基因组中共鉴定出101,438个蛋白质编码基因,其中96 922个(95.5%)位于19条染色体上;44 411个位于A亚基因组,52 511个位于C亚基因组,这与Darmor-bzh和ZS11基因组中的基因数量接近(表S3)。通过同源性搜索,97.89%的基因被至少一个蛋白质相关数据库注释(图 S2)。此外,在NTS57基因组中还还注释了36,552条非编码RNA(表S4)。NTS57基因组的注释显示,55.6%以上的基因组序列属于重复元件(表S5);其中80%是转座子元件,包括逆转录转座子和DNA转座子。在反转座子中,Gypsy 和 Copia 所占比例最高(表 S5)。基因组可视化显示,Gypsy和Copia在染色体上的分布模式总体相似,与基因密度呈现反相关;但在GC含量和DNA甲基化水平较高的中心粒附近,它们的分布模式却相反(图1B),这与之前的一项研究结果相似。基于染色体同源关系分析发现,两个亚基因组的同源染色体之间具有很强的基因组共线性(图 1B),显示出两个祖先二倍体基因组对应染色体之间的同源性。
甘蓝型油菜的系统发育和泛基因组分析
为了确定NTS57与其他油菜品种的系统发育关系,我们整合了9个已公布的不同生态型的甘蓝型油菜品种,包括3个冬型油菜(Darmor-bzh、Quinta和Tapidor)、4个半冬型(ZS11、Shengli、Zheyou和Gangan)和2个春性(Westar和No2127)油菜品种。利用 2,268 个单拷贝直系同源基因构建的最大似然树显示,NTS5的A亚基因组与半冬性油菜品种亲缘关系密切,而C亚基因组则与冬性油菜品种亲缘关系更为密切(图 1C)。这一结果表明,NTS57与中国培育的半冬性油菜具有不同的育种历史,其耐寒性可能是从冬性油菜中继承或保留下来的。随后,我们通过整合NTS57和其他9个油菜品种,研究了油菜的泛基因组结构。通过对蛋白质编码基因进行聚类,我们分别从A亚基因组和C亚基因组中鉴定出43,734和54,091个泛基因家族。当加入更多的亚基因组或物种时,A 和 C 亚基因组中鉴定出的基因家族数量迅速增加(图 1D),这意味着甘蓝型油菜因组具有丰富的基因库,单一的参考基因组无法包含甘蓝型油菜的全部遗传多样性。对A亚基因组而言,10个油菜品种中有超过18,375个基因家族是跨品种保守的,即为核心基因家族。在 2-9 个品系中出现的非核心基因家族占泛基因家族的55.69%,只有2.3%的泛基因家族具有品种特异性(图 S3A)。在C 亚基因组中,尽管核心基因家族的比例略低,但非核心基因家族的比例略高,核心、非必需和品种特异性基因家族的比例相似(图 S3B)。基因功能富集分析表明,核心基因家族和非核心基因家族在油菜生长发育中具有不同的功能(图 S4)。
通过比较基因组分析与耐寒性相关的SVs。在以 NTS57 为参考基因组的 9 个油菜品种中,共发现了 51,511 个插入、58,775 个缺失、29,645 个易位、15,654 个重复和 4,047 个倒位片段(图 1E)。人工合成的油菜品系 No2127的 SVs数量最多,Tapidor SVs数量最少。不同品系SV的总大小为 113.5-153.6 Mb,每个 SV 的长度从几十 bp 到几百 kb 不等,有个别结构变异超1 Mb (图 S5)。我们发现插入和缺失往往富集在染色体两端,而在中心粒附近则减少,其分布与基因密度的分布相似,而与 GC 含量的分布相反。与缺失和插入不同,倒位、重复和易位随机分布在19 条染色体上,尽管在中心点附近检测到一些富集(图 1F 和图 S6)。计算不同 SV 的染色体分布之间的相关性也证实了上述结果(图 1F)。
图1. 强抗寒冬油菜NTS57基因组测序和泛基因组分析
(A) NTS57全基因组 Hi-C 染色体互作热图。对角线显示 NTS57的A和C亚基因组具有较强的 Hi-C 染色体内相互作用。色条表示 Hi-C 染色体相互作用频率。(B) Circos图显示NTS57基因组组装和基因组特征。字母(a-i)分别表示NTS57的19条染色体、基因密度、GC含量、Copia转座子、Gypsy转座子、CpG甲基化、CHG甲基化、CHH 甲基化和染色体共线性;a中的黑色位置表示预测的着丝粒区域。(C) 利用 2,268 个单拷贝直系同源基因构建的最大似然树显示NTS57 和其他甘蓝型油菜品种的系统发育关系。(D) A和C亚基因组的泛基因组分析。(E) 以NTS57为参考基因组,其他油菜基因组中不同结构变异(SV)类型的数量。DEL、DUP、INS、INV 和 TRANS 分别表示缺失、重复、插入、反转和易位。(F) NTS57 基因组中的SV图谱。热图显示了不同 SV、GC 含量和基因密度(Gs)之间的相关性。
低温胁迫下NTS57基因动态表达和DNA甲基化图谱
为了鉴定NTS57基因组中抗寒相关基因,我们以新组装的NTS57基因组为参考基因组,分析了之前研究获得的正常和冷胁迫条件下转录组数据。与对照相比,我们在 T1(-4℃处理12小时)和T2(-4℃处理24小时)样本中分别鉴定到 15,888和22,479个差异表达基因(DEGs)(图 2A和表S6、S7)。显然,冷胁迫后时间越长,对应的冷响应基因数量越多。其中在两个时间点共同发生差异表达的基因12,346个(图 S7),表明这些基因可能是 NTS57 对冷胁迫做出反应的核心分子组分。另外,我们发现许多 DEGs 直接参与了植物的冷响应或冷适应过程,包括编码超氧化物歧化酶(SOD)、春花相关的VIN3、转录因子 LUX 、RNA 结合蛋白 CP29B、黄烷酮 3-二氧合酶 3和脱水反应元件结合蛋白2E (DREB2E) 等基因。此外,许多 DEGs 被注释为冷反应基因或冷诱导基因(表 S6、S7)。之后,对DEGs进行 GO 和 KEGG 通路富集分析。T1中的 DEGs 主要富集在昼夜节律调控、冷反应和木糖代谢等生物过程;在细胞组分水平,DEGs富集在细胞MCM 复合物、细胞壁和微管等分类上;在分子功能水平,富集在UDP-糖基转移酶、蛋白丝氨酸/苏氨酸磷酸酶活性和泛素蛋白连接酶活性等类别中(图 2B)。类似地,T2 中的 DEGs 除了富集与 T1 中 DEGs 相同的 GO类别外,也富集了与光合作用和单极细胞生长相关的功能类别中(图 S8),表明随着胁迫持续时间的延长,更多的生物过程在冷胁迫响应中受到影响。KEGG 通路富集结果显示,DEGs 主要参与了 MAPK 信号通路、昼夜节律、类黄酮生物合成和光合作用,该结果与 GO 富集分析的结果相似(图 S9)。为了确定NTS57 特异性的抗寒基因或通路,我们对冷敏感油菜 NF 栽培品种进行了类似的基因表达分析,根据之前的表型观察和生理测定,发现该品种的越冬存活率极低。主成分分析表明,冷胁迫下的 NTS57 和 NF 样本相互分离,表明冷处理后发生了特定的转录组变化(图 S10)。全基因组水平的比较转录组分析表明,NTS57 和 NF 样本在 T1(R = 0.68)和 T2(R = 0.79)的基因表达变化之间存在高度相关性(图 S11)。我们在 NF 的 T1 和 T2 样本中分别发现了 15,558 和 20,988 个高可信度DEGs(表 S8 和 S9),与 NTS57 中的DEGs数量相当。此外,NF中的许多DEGs与NTS57中鉴定的DEGs由很大部分是重叠的(图S12)。NF品种油菜在两个胁迫时间点的DEGs与NTS57中的DEGs具有类似的基因功能富集条目(图 2B 和图 S8、S13),这意味着这些生物学过程在冷胁迫下不同油菜品种中均为必需的。此外,尽管两个品种的转录组变化高度相似,但在 T1 或 T2 样品中,一些基因只在 NTS57 中表达,而不在 NF 中表达(图 S11),这可能是两个品种耐寒性不同的原因。富集分析结果显示,在生物过程、细胞组分和分子功能方面,参与微管相关的生物学过程的基因在NTS57中发生了特异性改变(图S14)。在冷胁迫下,NTS57中微管相关基因的基因表达变化要高于NF中的表达变化,尤其是A05G015370(TUBB7)、A06G029560(TOR1L3)和C05G002130(TPX2)(图2C)。这些结果表明,微管相关过程在 NTS57 中比在 NF 中更活跃,可能是 NTS57 耐寒的原因之一。
之前的报道发现,冷胁迫可诱导许多植物物种的基因组发生去甲基化。通过计算 NTS57 基因组的全基因组DNA甲基化水平,我们发现冷胁迫后基因和其侧翼区域所有胞嘧啶序列类型(即 CpG、CHG 和 CHH)的甲基化水平都显著下降(图 2D)。其中,CHH 甲基化的下降最为明显,其次是 CHG 和 CpG 甲基化,按时 CHH 甲基化对冷胁迫更为敏感。当A和C亚基因组分别计算时,观察到了类似的趋势(图 S15),这与之前的研究结果一致。在植物中,DNA 甲基化富集在异染色质 TE 和重复元件上 。的确,在 NTS57 基因组中,重复序列(包括长末端重复序列、DNA 转座子和串联重复序列)上的 DNA 甲基化程度很高(图 2E)。然而,我们注意到串联重复序列中的CHG和CHH甲基化有两个例外,即与周围区域相比,它们呈现低甲基化(图2E)。我们还发现,在冷胁迫下,NTS57 所有重复序列和所有类型的甲基化水平都下降,这与基因区的情况非常相似,表明甲基化酶在植物冷胁迫响应中以类似的方式作用于基因和重复序列。
图2. 低温胁迫下NTS57基因动态表达和DNA甲基化图谱
(A)桑基图显示 NTS57 在 -4°C 冷胁迫 12 小时(T1)和 24 小时(T2)后上调和下调的基因。CK:25°C的正常条件。(B) T1 样品中 DEGs 的基因功能富集。BP:生物过程;CC:细胞成分;MF:分子功能。(C) NTS57 和 NF 在冷胁迫下参与微管过程的特异性 DEGs 表达变化热图。(D)正常和冷胁迫条件下 NTS57 基因组中基因及上下游区域的甲基化水平。TSS,转录起始位点;TTS,转录终止位点;LTR,长末端重复。基因被分为 100 个大小相等的分区。对于每个基因的每个分区,甲基化水平的计算方法是用甲基化的 Cs 总数除以 Cs 总数,然后用窗口中所有蛋白编码基因甲基化水平的平均值生成甲基化图谱。CpG、CHG 和 CHH三种甲基化类型的图谱独立计算。(E) NTS57重复元件的甲基化水平图谱。
iMetaOmics
更多资讯
● iMeta姊妹刊iMetaOmics(定位IF>10)欢迎投稿!(2024.2.27)
● iMeta姊妹刊iMetaOmics编委招募 (定位IF>10) (2024.3.2)
● iMeta姊妹刊iMetaOmics电子版和印刷版ISSN申请获批(2024.4.1)
● iMeta姊妹刊iMetaOmics投稿系统正式上线(2024.4.17)
● iMeta姊妹刊iMetaOmics主编正式官宣(2024.4.22)
● 出版社iMetaOmics主页正式上线!(2024.4.28)
● iMetaOmics | 浙江大学宗鑫组揭示两猪种宿主-肠道菌群互作差异
● iMetaOmics | 罗鹏/袁硕峰/苗凯/程全发表STAGER: 生成式人工智能可靠性的标准化测试和评估推荐
● iMetaOmics | 徐州医科大杨欢组揭秘沙门氏菌-宿主-微生物群在免疫与代谢中的相互作
● iMetaOmics | 中科院动物所金坚石组综述16S rRNA基因扩增子测序技术的“前世今生”
● iMetaOmics | 浙大张天真组完成二倍体棉种泛基因组构建
● iMetaOmics | 张勇/李福平-先进糖蛋白组学在男性生殖研究中的潜在应用
● iMetaOmics | 暨南大学潘永勤/杨华组-炎症蛋白联合检测利于诊断甲状腺乳头状癌和结节性甲状腺肿
● iMetaOmics | 张开春组利用多组学方法揭示甜樱桃加倍后果色变化的候选基因
● iMetaOmics | 杜娟/林婷婷-慢性泪囊炎患者眼部菌群类型和纵向菌群变化
● iMetaOmics | 陈汉清/陈俊综述有关肝细胞癌治疗的新兴纳米医学策略
● iMetaOmics | 基因组所刘永鑫/卢洪评述微生物在提高杂种优势中的作用
● iMetaOmics | 上科大刘雪松组开发基于通路的肿瘤细胞鉴别工具TCfinder
● iMetaOmics | 中山大学刘鹏/邹宇田-整合人工智能实现HER2阳性乳腺癌精准管理
● iMetaOmics | 安徽农大李晓玉组-丛枝菌根真菌对玉米内生菌群的影响
● iMetaOmics | 徐涛/黄蓉/苏国海-急性冠脉综合征纵向多组学队列建设
● iMetaOmics | 通过整合宏组学促进人类与环境健康发展
● iMetaOmics | 苏州大学林俊组-揭示活性微生物及益生元/益生菌与关节炎联系
● iMetaOmics | 中国药科大学徐文波开发叶绿体基因组数据分析软件
● iMetaOmics | 清华刘晓组和复旦王久存组揭示特定细菌在皮肤老化中的作用
●iMetaOmics | 中南大学夏晓波团队揭示青光眼和SLE发病机制新关联
●iMetaOmics | 庐山植物园刘芬组揭示了自噬在植物-根微生物互作机制中的调控作用
●iMetaOmics | 杨瑞馥/袁静综述微生物组与“同一健康”的联系
●iMetaOmics | 陈绍鸣-关于靶向NF-κB的潜伏逆转剂及其在HIV潜伏期的表观遗传和突变影响的评论
代码和数据可用性
本研究产生的所有原始测序数据和基因组组装序列可在 NCBI 数据苦中获取,登录号为 PRJNA1012021。基因组注释文件和其他相关文件可在 figshare (https://doi.org/10.6084/m9.figshare.24098538.v1) 或本研究开发的数据库 (http://oilseed.online:8000/) 中获取。本研究使用的数据和脚本保存在 GitHub上(https://github.com/Zefeng2018/NTS57_genome_assembly)。本研究的补充材料(方法、图、表、图解摘要、幻灯片、视频、中文翻译版本和更新材料等)可在在线 DOI 或 iMeta Science(http://www.imeta.science/imetaomics/)中获取。
引文格式:
Zefeng Wu, Guoqiang Zheng, Yali Sun, Xiaoyun Dong, Ying Wang, Hui Li, Jiaping Wei, Junmei Cui, Yan Fang, Yinin Niu, Zhen Huang, Jihong Hu, Zigang Liu. 2024. “Genome assembly and genomic architecture of a prominent cold-resistant rapeseed germplasm.” iMetaOmics. http://doi.org/10.1002/imo2.32
武泽峰(第一作者)
● 甘肃农业大学-省部共建干旱生境作物学国家重点实验室助理研究员。
● 研究方向为生物信息学与基因组学,以第一作者在New phytologist、Plant and Cell Physiology、BMC genomics等期刊发表SCI论文5篇。主持甘肃省自然科学基金、甘肃省教育厅青年博士基金、中央财政专项发展基金子课题等项目若干项。
刘自刚(通讯作者)
● 甘肃农业大学-省部共建干旱生境作物学国家重点实验室研究员,博士生导师。
● 研究方向为油菜遗传育种。带领团队首次育成强抗寒甘蓝型冬油菜甘油221等系列品种,可抗-26.5℃极端低温,是目前最抗寒的甘蓝型冬油菜之一,兼有优质高产抗倒伏等优异表现;育成强抗寒白菜型冬油菜“甘油160”等油菜新品种10余个,解决了我国白菜型冬油菜株型差、倒伏严重等问题。主持国家及其它科研项目10余项,其中国家自然基金项目1项,国家重点研发课题1项,国家农业科技成果项目1项、省部级项目5项、厅局级项目5项。获得省部级科技奖5项,其中一等奖2项(2017-J1-010-R2、KJ2013-R1-009-03),二等奖1项,三等奖2项(FCG-2013-3-127-02R,2001-3-051/6);授权国家发明专利20余件;制定地方标准10项;出版专著3部;在《Plant Physiology and Biochemistry》、《Plant Science》、《中国农业科学》、《作物学报》等期刊发表研究论文120余篇。
(▼ 点击跳转)
高引文章 ▸▸▸▸
iMeta | 引用14000+,海普洛斯陈实富发布新版fastp,更快更好地处理FASTQ数据
高引文章 ▸▸▸▸
iMeta | 德国国家肿瘤中心顾祖光发表复杂热图(ComplexHeatmap)可视化方法
高引文章▸▸▸▸
iMeta | 高颜值绘图网站imageGP+视频教程合集
1卷1期
1卷2期
1卷3期
1卷4期
2卷1期
2卷2期
2卷3期
2卷4期
3卷1期
2卷2期封底
2卷4期封底
3卷2期
3卷3期
3卷3期封底
3卷4期
3卷4期封底
1卷1期
“iMeta” 是由威立、肠菌分会和本领域数百千华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表所有领域高影响力的研究、方法和综述,重点关注微生物组、生物信息、大数据和多组学等。目标是发表前10%(IF > 20)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。2022年2月正式创刊发行!发行后相继被Google Scholar、ESCI、PubMed、DOAJ、Scopus等数据库收录!2024年6月获得首个影响因子23.7,位列全球SCI期刊前千分之五(107/21848),微生物学科2/161,仅低于Nature Reviews,同学科研究类期刊全球第一,中国大陆11/514!
“iMetaOmics” 是“iMeta” 子刊,主编由中国科学院北京生命科学研究院赵方庆研究员和香港中文大学于君教授担任,是定位IF>10的高水平综合期刊,欢迎投稿!
iMeta主页:
http://www.imeta.science
姊妹刊iMetaOmics主页:
http://www.imeta.science/imetaomics/
出版社iMeta主页:
https://onlinelibrary.wiley.com/journal/2770596x
出版社iMetaOmics主页:
https://onlinelibrary.wiley.com/journal/29969514
iMeta投稿:
https://wiley.atyponrex.com/journal/IMT2
iMetaOmics投稿:
https://wiley.atyponrex.com/journal/IMO2
邮箱:
office@imeta.science