重磅！宏基因组产品升级——病毒可以拼接完成图啦！

文摘 2024-11-25 08:00 内蒙古

病毒是目前已知具有极高多样性的生物实体。病毒通常通过宏基因组组装序列进行研究，但基因组的不完整性妨碍了全面和准确的分析。因此，进一步提升宏基因组数据拼接得到的病毒基因组的完整性和质量显得尤为重要。

因此，宏病毒组分析中最常见的一个问题的就是，如何获得既完整又准确性高的vOTUs序列？

为了解决这个问题，凌恩生物开发了宏基因组组装病毒完成图的个性化分析！基于宏基因组、DNA/RNA宏病毒组，通过COBRA软件提升由宏基因组组装的病毒基因组的完整性和连续性，进而深入挖掘病毒的种类和功能多样性！

图1 COBRA的工作流程图[1]

COBRA的输出结果分为三大类：原本就是环状的基因组序列；（a）延伸成环状基因组的序列，（b）延伸成非环状基因组的序列，（c）因测序深度等问题而未能成功延伸的序列；无法延伸的contigs序列。

图2 宏基因组组装病毒完成图的个性化分析结果展示

2024年2月6日，《Nature Microbiology》期刊上发表了加州大学伯克利分校陈林兴博士的研究文章——“COBRA improves the completeness and contiguity of viral genomes assembled from metagenomes”。该研究通过分析基于宏基因组拼接过程中出现的基因组片段化问题，基于重叠的序列重组（COBRA）通过de Bruijn图解决组装断点并连接contig。通过分析海洋病毒和土壤病毒数据集，验证了COBRA能够准确拼接高质量完整病毒基因组，表明COBRA比传统的Binning工具实现了更高的基因组准确性。

通过分析231个公布的淡水宏基因组，COBRA帮助识别出7334个噬菌体簇，其中约83%代表新的噬菌体物种，且约70%的噬菌体基因组为环状，而在COBRA分析前只有34%；④COBRA还促进了对巨大噬菌体（≥200kbp）的采样，其中最大的噬菌体基因组长度达到717kbp。通过改善Rotsee Lake的噬菌体基因组，COBRA为宏转录组数据提供了背景，揭示了巨大噬菌体、whiB编码噬菌体以及cysC-和cysH-编码噬菌体的原位活动情况。总之，COBRA 改善了病毒基因组组装的连续性和完整性，从而提高了基因内容、多样性和进化分析的准确性和可靠性。

图3 来自淡水生态系统的环状和高质量噬菌体基因组概述。

a.高质量的“自环”和“扩展环”基因组数量。b.COBRA用于生成扩展高质量和环状基因组序列的质量。基因组的质量通过CheckV进行评估。c.COBRA序列的长度及其对应的“扩展部分”高质量基因组和“扩展环”基因组的序列。d.病毒基因组的聚类。条形图显示(1)识别为噬菌体、病毒噬菌体、真核病毒和未确定（“其他”）的簇的数量。图中还显示了7334个噬菌体簇的详细信息，包括(2)环状和高质量代表性基因组的数量，(3)它们的长度分布，(4)每个簇中的基因组数量，(5)在每个簇中检测到的位点数量，以及(6)每个簇的分类注释。Caudo，Caudoviricetes。“Caudo; other”表示除列出的科外的其他科。“Caudo; unknown”表示所有只能在Caudoviricetes级别上分类的科。e.本研究通过与已发布基因组的比较，识别的噬菌体物种基因组的新颖性。在6046个新报告的噬菌体物种基因组中，4109个是环状的，1937个是高质量的。

图4 来自淡水生态系统的基因组扩展了巨大噬菌体的多样性。

a.本研究中新报告的来自淡水宏基因组的巨大噬菌体的数量和长度，以及通过COBRA连接的相应序列（≥10 kb）。b.基于核心结构蛋白的连接序列构建的巨大噬菌体的系统发育。内环中的彩色条纹表示基因组的来源（已发布或本研究中）。中环中的彩色条纹表示重建噬菌体基因组的栖息地。外环中的彩色条纹表示基因组的预测分类。大多数（>80%）基因组在本研究中重建的亚类用红色突出显示。两个基因组大小超过700 kb的噬菌体（一个已发布，一个来自本研究）用红星标出。c.结合DNA和RNA分析的Rotsee湖巨大噬菌体在六个样本中的检测和转录谱。黑点表示对应样本中巨大噬菌体的RNA RPKM大于DNA RPKM。d.来自不同采集地点的相似巨大噬菌体的基因组比较。展示了三对作为例子（参见扩展数据图9以获取Mauve比对）。结构蛋白基因用紫色表示，其相应的注释包括在内，DNA代谢相关基因用粉色表示。

凌恩生物宏基因组组装病毒完成图个性化分析！提升vOTUs组装质量，深化科研质量。更多测序项目了解，请关注凌恩生物公众号，紧跟CNS步伐，用最新的分析方法助力您的科研！

参考文献

COBRA improves the completeness and contiguity of viral genomes assembled from metagenomes. Nature Microbiology, 2024.

凌恩生物

凌恩生物旗下综合性生物咨询和服务平台。

最新文章

Cell Metabolism | 用别人的单细胞数据也能发27+？

产品更新| 遗传图谱+物理图谱，加速QTL定位分析！

KEGG大更新：开启生物研究新纪元

精准识别：专用引物提升叶际与植物内生菌鉴定精度

单细胞研究新热点：宿主-微生物互作分析

宏转录组+HiFi宏基因组：揭示厌氧消化中的碳流和能量转换

产品升级！Science子刊同款ARGs-HOST分析，get！

Amazing, 数据库也能发Nature？！

双因素研究：湿地类型与季节对微塑料生物膜的影响

双剑合璧：转录组+宏基因组揭示微生物与宿主互作机制

智慧之旅不止步！凌恩生物11月客户文章累计IF>532！

eDNA多营养级环境关联核心物种挖掘，Nature子刊教你还能这样做！

客户佳作|基因组解析新方法——单细胞DNA测序

一区10+ | 微生物功能+宿主转录组，突破反刍动物瘤胃发育机制！

CNS新热潮—单细胞层面的宿主与微生物关联分析

一文读懂基因组过滤：专业术语解析（二）

"暖心预付，冬日好礼相送 —— 凌恩生物2024冬季专享优惠活动"

重磅更新！双因素扩增子分析流程来了！

C4平台|单细胞核RNA测序揭示骨骼肌卫星细胞生物学功能

用RNA-seq打开重测序样本，快速发掘性状关联基因？

一文读懂基因组过滤：专业术语解析（一）

宏基因组+宏转录组双剑合璧，让您的研究脱颖而出!

重磅！宏基因组产品升级——病毒可以拼接完成图啦！

国产单细胞也能发CELL！

果味升级：多组学助力桃子风味改良

eDNA也能发Nature？！

单菌研究最佳拍档——宏基因组+qPCR

全新升级抗性宏基因组，直击病毒和毒力因子分析！

IF=7.6|单物种数据库构建标准流程

Nature子刊 | 单细胞测序打开发育系统溯源新视角

单细胞技术加持，扩增子测序重回高大上| 一区微生物多组学研究新思路！

研界的福尔摩斯——扩增子+qPCR

产品升级！肠道宏基因组微生物营养代谢新方向！

智慧之旅不止步！凌恩生物10月客户文章累计IF>452！

前沿快报|泛基因组在动植物研究中最新进展

【科研前沿】揭秘树蕨抗性基因：转录组与代谢组双剑合璧

微生态研究新热潮：微生物绝对定量（二）

"暖心预付，冬日好礼相送 —— 凌恩生物2024冬季专享优惠活动"

宏组学干货|一文get宏基因组产品如何选择

动物食性分析—eDNA+多营养级

C4单细胞|仅7个样品拿下高分文章！

多生境扩增子探秘：深度溯源与多样性解析

展会公告|第8届深海微生物国际学术研讨会(中国厦门)

如何认识泛基因组？从单一到多元？

展会公告|第8届深海微生物国际学术研讨会(中国厦门)

敢为天下先：三代宏基因组cMAGs交付承诺

拯救选择困难症！凌恩生物告诉您如何有效选择eDNA引物！

Nature子刊｜宏病毒研究新热点-元素循环

测序界的白宫严选，国产纳米孔测序测评报告，诚邀现场交流！

展会公告 | 凌恩生物与您相约2024年中国生态学学会微生物生态专业委员会2024年学术年会

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉