两栖动物是四足动物中多样化程度较高的一个分支,其三大类群的分化时间非常久远。从基因组学角度研究两栖动物生物学有助于加深我们对这一类群及其他陆生脊椎动物特征的理解。由于该类群面临的威胁日益增多,迫切需要更多的两栖动物基因组资源。目前大约41%的两栖动物物种由于栖息地丧失、土地利用模式变化、疾病、气候变化及其协同作用而面临灭绝威胁。两栖动物的基因组资源为我们更深入理解,包括个体发育多样性、组织再生、多样的生活史和繁殖模式、反捕食策略以及适应能力和应对能力,提供了基础资源。这些资源还为研究普遍的基因组特征提供了重要模型,如进化中的基因组扩张和收缩现象,因为两栖动物在所有动物类群中表现出最广泛的基因组大小变化,并具有多种遗传性别决定机制。尽管这些特征十分显著,但两栖动物的基因组测序相较于其他脊椎动物仍然大幅滞后,主要原因在于大规模、重复序列丰富的基因组的组装存在困难,以及社会支持的相对匮乏。随着长读长测序技术的兴起,结合能够改进基因组scaffolding和减少计算工作量的先进分子和计算技术,现已可以解决其中一些挑战。为了通过国际协调与合作促进并加速两栖动物基因组学研究的产出和应用,我们于2023年初发起了两栖动物基因组联盟(AGC,https://mvs.unimelb.edu.au/amphibian-genomics-consortium)。这个新兴的社区目前已拥有来自41个国家的282名成员。AGC旨在利用其成员的多样性,推动两栖动物基因组资源的发展,并弥合生物学家、生物信息学家和保护工作者之间的鸿沟。本文评估了两栖动物基因组学领域的现状,重点介绍了以往的研究,提出了需要克服的挑战,并呼吁研究和保护界人士加入AGC,共同推动两栖动物基因组学研究迈上新台阶。
两栖动物研究领域的现状
2010年,热带爪蟾(Xenopus tropicalis)的基因组首先被测序,标志着两栖纲首个基因组组装的完成。该物种是细胞生物学、分子遗传学和发育生物学领域中重要的实验室模式生物。这一两栖动物基因组的组装是在其他脊椎动物类群首个基因组完成之后多年实现的:2002年为鱼类(Fugu rubripes),2003年为哺乳动物(Homo sapiens),2004年为鸟类(Gallus gallus),2007年为爬行动物(Anolis carolinensis;Anolis Genome Project https://www.broadinstitute.org/anolis/anolis-genome-project)。自那时以来,两栖动物参考基因组的生成和注释显著滞后于其他脊椎动物类群,尽管两栖动物约占所有四足动物的22%。15年后,两栖动物仍然是四足动物中已测序基因组数量最少的类群(8648种已描述的两栖动物中仅有111个基因组代表,位居四足动物倒数第二,仅多于非鸟类爬行动物,即鳄目、鳞龙类和龟鳖目;数据库记录截至2024年3月1日,见图1A和补充文件1)。这很可能是由于两栖动物的基因组普遍大于其他陆生脊椎动物的基因组(见图1B和图S1;方法学信息参见补充材料)。事实上,在所有脊椎动物中,只有肺鱼的基因组比最大的两栖动物基因组更大(肺鱼的基因组可达130 Gb,而纽斯河泥螈(Necturus lewisi)的基因组可达约120 Gb)。
图1 四足动物各类群基因组测序现状
为了降低成本并增强可行性,早期的两栖动物基因组测序项目倾向于选择基因组相对较小的物种(见图1B)。这导致了蝾螈类的基因组测序数量相对较少,因为蝾螈是基因组最大的两栖动物。目前,蝾螈类基因组组装的最大记录来自三个物种:墨西哥钝口螈(Ambystoma mexicanum,27.3 Gb组装),西班牙肋突螈(Pleurodeles waltl,20.3 Gb),以及这种蝾螈(Calotriton arnoldi,22.8 Gb)。然而,这些物种的基因组规模仅代表了该类群的较小范围,而泥螈属蝾螈的基因组则超过100 Gb(见图2)。
除了基因组庞大之外,两栖动物基因组由于其广泛的重复序列(高达82%)也给组装工作带来了挑战。两栖动物的转座子在较年轻的进化支中迅速扩张并且十分丰富,这对构建连续的基因组带来了挑战。这些基因组特征使得测序和组装的成本高昂,且技术要求复杂(例如,使用短读长测序时,重复区域往往导致组装碎片化)。然而,随着新测序方法的出现,如长读长测序技术(例如PacBio HiFi和Oxford Nanopore Duplex)、Hi-C scaffolding 技术的应用以及测序成本的降低,许多组装难题已得到解决(如高山倭蛙(Nanorana parkeri)的基因组组装)。
图2 两栖动物各类群基因组大小预估
因此,近年来两栖动物基因组组装数量迅速增加,截至2024年初, NCBI的基因组数据库中有111个两栖动物参考基因组达到scaffold水平或更高(包括52个无尾目、55个有尾目和4个蚓螈目;NCBI基因组数据库记录截至2024年3月1日)。尽管数量快速增加,现有两栖动物基因组的质量差异显著:其中只有38个为染色体级别组装,且仅有16个经过注释。这表明现有大多数基因组组装是不完整或部分组装的。例如,最近发表的Desmognathus属蝾螈的基因组组装大小约为1 Gb,而基于流式细胞术或图像密度测定法估算的基因组大小平均为14 Gb。此外,许多不完整基因组的基因含量值可能低至0.7%。除了质量差异之外,整个两栖纲的基因组代表性还存在显著的分类学空白。尤其是,77个两栖动物科中有48个科(62%)在NCBI基因组数据库中没有代表性的基因组组装(见图2B),这表明我们对这一类群的认识仍存在重大空缺(有关这48个科的更多信息,见“AGC的基因组测序目标”部分和表1)。
由于基因组组装的困难,以往的大多数两栖动物基因组研究依赖于其他高通量测序方法,包括RNA测序(RNA-seq)、简化或目标捕获技术,或宏基因组方法(见图3和补充文件2,其中包含截至2024年3月1日通过NCBI序列reads档案[SRA]使用搜索词“Amphibia”检索到的信息)。例如,RNA-Seq技术已被用于研究超过300个不同的两栖动物物种的基因表达。此外,通过NCBI转录组组装(TSA)数据库提供的大量从头组装的转录组(共79个:59个无尾目、15个有尾目、5个蚓螈目)也可供使用。近年来,各种简化基因组测序(如ddRADseq)和目标捕获测序方法也被应用于从超过1400个两栖动物物种中获取全基因组序列信息。这些信息——从完整基因组到基因转录特征——推动了我们对两栖动物生物学的理解,并直接为下文所述的保护工作做出了贡献。
图3 应用于两栖动物的主要测序技术
通过两栖动物基因组学来推进研究与保护工作
两栖动物具有许多独特的特征,使得它们成为许多学科研究的对象,涵盖了从发育生物学、医学研究到生态学和进化学等领域。基因组学工具的快速发展正在推动两栖动物生物学的研究步入快速路,揭示了其生物学和保护方面的重要属性。我们在此列举了一些例子,并强调构建两栖动物基因组资源的迫切需求,以延缓进一步的生物多样性丧失,这是最终目标。
胚胎发生、发育生物学与再生生物学
两栖动物在揭示发育原理方面发挥了基础性作用。对无尾目两栖动物的研究增进了对关键发育机制的理解,例如卵子不对称性的打破、轴的建立以及神经传导。值得注意的是,非洲爪蟾(Xenopus laevis)和热带爪蟾(X. tropicalis)基因组组装的可用性大大推动了胚胎学和发育生物学的发展。这一进展通过转基因与RNA干扰、基因编辑以及改进的morpholino设计相结合,推动了基因功能丧失的研究。这使得发育过程中调控性和非编码基因组的机制得以深入分析。因此,这些研究为这两个物种生成了数千个基因组和转录组资源。然而,关于两栖动物发育的研究仍有许多未解之谜,尤其是考虑到两栖动物在发育模式上表现出的多样性,这可能是脊椎动物中最高的。这包括直接发育(从卵到幼蛙;2024年发布的首个直接发育两栖动物基因组是Eleutherodactylus coqui)以及表型可塑性。
性发育与性别决定
在两栖动物中性别系统也是多样且独特的。与大多数哺乳动物和鸟类具有退化的Y和W染色体不同,大多数两栖动物的性染色体未分化,这使得通过传统细胞遗传学技术研究性别进化极为困难。然而,性别决定系统正开始通过高通量测序得以进一步解析。例如,多组学技术的应用使得在绿蟾蜍(Bufotes viridis)中鉴定出位于bod1l基因5’区域的Y特异性非编码RNA,这与雄性性别决定有关。
令人惊讶的是,某些蝾螈(Ambystoma属)以全雌多倍体世系存在,能够从最多五个其他有性物种中吸收新的染色体组。这些蝾螈的转录组学分析显示,它们分化基因组中的基因表达对于某些基因是平衡的,而对于其他基因则存在偏差。两栖动物的性发育可能导致性二态性特征,例如角质刺性,已通过比较基因组学方法在雷山髭蟾(Leptobrachium leishanense)中得到研究。
随着越来越多的两栖动物基因组的发布,人们将能够更深入地理解其个体发育多样性的分子机制。染色体级别的参考基因组提供了高分辨率的数据,这对于识别性别决定区域至关重要,并揭示了这些过程的新见解,帮助应对因温度波动和内分泌干扰物增加而导致的性别逆转问题。
变态发育
变态发育使许多两栖动物物种有别于羊膜动物。转录组学研究揭示了青蛙和蝾螈在幼体和成体阶段之间基因表达的显著变化。这代表了这些生活史阶段在基因组上的解耦,并具有重要的宏观进化意义。两栖动物的组学方法正在迅速增进我们对变态发育过程的理解,包括甲基化及其他表观遗传标记在基因调控中的作用。研究还发现两栖动物通过多种方式对环境扰动作出响应,例如改变发育速度,通过杂交获得正向适应效应,产生新的营养形态,以及通过亲缘识别避免同类相食。然而,目前对这些机制得理解仍然不充分,需要进一步的基因组学研究。
由于其卓越的组织修复和再生能力,两栖动物是研究再生机制的重要模式生物。这在蝾螈中尤为突出,因为它们展示了脊椎动物中最广泛的成体再生能力,包括再生眼、脑、心脏、下颌、肺、脊髓、尾巴和整个肢体的能力。随着墨西哥钝口螈(Ambystoma mexicanum)和西班牙肋突螈(Pleurodeles waltl)等蝾螈物种新基因组的发布,再生机制现在可以通过转基因技术、先进成像技术和基因编辑等手段进行研究。这两个蝾螈物种的大规模转录组测序促进了基因表达研究,包括再生过程的研究和其他基因组特征的描述。此外,在西班牙肋突螈中,最近还描述了一种新的端粒长度维持和延长机制,这可能将再生能力与长寿联系起来。其他两栖动物物种也为再生的基因组学研究作出了贡献,例如绿红东美螈(Notophthalmus viridescens)的基因表达资源的早期数据库。
生态学与进化
现代两栖动物是所有羊膜动物的姐妹类群,使其成为研究物种关系和性状进化的宝贵资源。例如,关于青蛙的快速多样化、视力的进化、杂交发生和无肢化的进化等研究都突显了这一点。两栖动物的系统发育基因组学已经解决了许多长期存在的两栖动物进化问题。包括两栖动物类群的比较基因组学分析还揭示了我们对四足动物分子进化理解中的重要空白,如染色体重排和尚未分类的特定类群基因家族。尽管如此,仍有许多未解的问题和未解决的进化关系,这些问题可以通过高质量的基因组得到解答,尤其是在揭示转座子在适应和进化中的作用方面。在本节中,我们探讨了基因组学如何应用于理解两栖动物独特的生态与进化特征。
与哺乳动物、鸟类和爬行动物一样,一些两栖动物也进化出了在高海拔环境中生存的能力,如安第斯山脉(海拔高达5400米)和青藏高原(海拔4478米)。然而,与其他类群不同的是,两栖动物缺乏毛发、羽毛或鳞片来保护它们免受紫外线等生理压力的影响。这种脆弱性使它们成为研究紫外线辐射效应的有趣模型,这不仅与人类相关,也与受气候变化影响的物种。两栖动物已经进化出了多种抵御紫外线的机制,包括提高抗氧化能力和在防御路径中的基因调控变化。有证据表明,影响其他高海拔特征的基因(如耐低氧、免疫力、耐寒性)在不同科的物种中(如叉舌蛙科、蟾蜍科、角蛙科、蛙科)趋同进化,并且许多这样的基因在种内的分化与海拔相关,深化了我们对环境条件如何影响进化过程的理解。虽然我们开始了解一些亚洲和北美青蛙的高海拔适应的遗传机制,但对于其他高海拔的两栖动物,如安第斯山脉的无尾目(如Telmatobius culeus)和高海拔的蝾螈(如Pseudoeurycea gadovii),尚缺乏基因组数据。
毒素的产生或吸收能力已经在所有三类两栖动物中进化出来,主要作为一种反捕食机制。两栖动物毒素的来源各不相同:一些物种能够合成毒性化合物(如蟾蜍科、肌蛙科),而另一些则从食物中吸收毒素(如箭毒蛙科、曼氏蛙科)或通过微生物共生体获取毒素(如蝾螈)。由于箭毒蛙科青蛙从猎物(如螨类和蚂蚁)中获取毒素,它们缺乏编码这些毒素的基因。然而,它们需要基因来促进这些毒素向皮肤的运输。最近的基因组学和蛋白质组学研究发现了编码可能在毒素运输和抗毒性方面发挥双重作用的蛋白质的候选基因。比较基因组学研究还发现了特定的突变,这些突变使有毒的两栖动物物种能够有效缓解所吸收毒素对其自身组织的影响。皮肤转录组也已成为数据挖掘的丰富来源,帮助识别了各种两栖动物中的候选毒素和抗菌肽,这些发现可能在未来被用于人类医学治疗。
有毒的两栖动物与捕食者之间的互动导致了多样化的共同进化——“军备竞赛”。这些包括在两栖动物捕食者中已被充分研究的抗毒性机制,以及有毒物种的警戒色和拟态。研究警戒色和拟态的工作利用了全基因组测序、外显子捕获和转录组测序,阐明了箭毒蛙科物种间以及种群间丰富多样的色彩模式背后的基因。这些方法为理解基因、基因网络和生化途径提供了丰富的信息,这些基因和途径决定了其他两栖动物类群(包括高度分化的警戒色物种,如澳大利亚肌蛙科的Pseudophryne corroboree、马达加斯加毒蛙曼氏蛙科)、蚓螈(如Schistometopum thomense)和火蝾螈(如Salamandra salamandra)的色彩变化)。实际上,这些方法已经帮助识别了火蝾螈亚种S. salamandra bernardezi中与色彩相关的基因和基因位点。
尽管两栖动物组学在阐明进化和生态机制方面取得了诸多进展,要完全解开其遗传基础仍需要获取大量基因组数据,这是因为这些领域具有比较性质,每个类群的进化独特性也各不相同。两栖动物研究中的一些激动人心的方向包括行为适应,如亲代抚育、蚓螈的产奶或皮肤喂养、空间导航能力;适应环境条件,如由于滑翔能力进化导致的生态位扩展、无肺化的进化;以及捕食者与猎物的相互作用,如某些蝾螈将肋骨穿透皮肤毒腺进行防御的独特防御机制。
保护现状
两栖动物是最濒危的脊椎动物类群,当前的估计显示超过40%的物种面临灭绝威胁。两栖动物所面临的威胁仍在不断增加,这表明迫切需要开发创新且有效的保护方法。矛盾的是,目前两栖动物物种的新发现速率呈指数增长,全球范围内许多候选物种正在被标记出来。这表明我们距离克服两栖动物的“林奈缺失”还有很长的路要走,尤其是在热带地区。因此,受威胁物种的数量可能被低估,因为未描述的物种无法进行评估,并且更有可能在未被发现前灭绝。此外,许多两栖动物的保护状态仍然未知,尤其是热带物种和一些土栖蚓螈,仅有少量标本可供研究。生成基因组数据是应对这一挑战的方法,因为它可以用于估算物种的进化潜力和灭绝风险。基因组对于理解物种界限及其遗传多样性的地理分布至关重要,并有助于识别因人类活动或气候变化而面临更高风险的种群。这些特性使得基因组资源对于制定物种保护行动计划具有不可估量的价值
两栖动物保护工作应借助群体遗传学理论和不断发展的保护基因组学研究。这些方法可以量化基因组中的中性和适应性多样性,从而通过迁移计划促进适应潜力或进行遗传拯救。高质量的基因组还可以推动更全面的遗传多样性分析,除了单核苷酸多态性(SNPs)之外,还可以分析结构变异,后者往往被忽视,并改进同型纯合区段(ROH)的分析。
通常,这些研究从对不同环境条件下的种群进行基因组表征开始,评估种群的遗传健康和疾病风险。它们还可以通过识别因潜在的遗传威胁(如不适应性等位基因、遗传负担、近亲繁殖和远交衰退、杂交以及遗传不相容性)而面临下降风险的种群,支持监测和预警工作。增加对基因组多样性的监测和维护是许多国家和国际倡议中的关键目标,如美国《濒危物种法》、《昆明-蒙特利尔全球生物多样性监测框架》,以及两栖动物保护行动计划。
更具体的两栖动物基因组学应用于保护
要将两栖动物基因组学更具体地应用于保护工作,必须理解影响适应性性状的遗传基础,如抗病性或对气候变化的耐受性。长读长测序技术的日益普及对于解决识别与免疫过程(如主要组织相容性复合体,MHC)相关的高度可变基因区域的挑战尤为重要。这些信息可以用于促进适应性,通过靶向基因干预(TGI)等方法来提高适应性等位基因的频率,手段包括选择育种、基因组编辑或靶向基因流。大量研究已投入于理解抵抗毁灭性两栖动物病害壶菌病的遗传基础,这些研究已经鉴定出多个候选基因,可以通过TGI加以利用,增加对壶菌病的抵抗力。
TGI提高壶菌病抗性的有效性已经在北美山区Rana属(Rana muscosa和R. sierrae)中得到了证明,移植抗性个体能够提高群体的存活率。尽管使用遗传干预方法进行保护具有显著吸引力,但这些方法应尽可能在受控设施中进行评估,并伴随长期监测,以确保其有效性并排除任何意外影响。虽然这些保护干预措施需要大量资源,但对于一些面临顽固威胁(如壶菌病)的物种来说,这可能是恢复它们的唯一有效方法。
两栖动物基因组研究的挑战及未来发展方向
两栖动物组学研究的未来依赖于高质量的参考基因组,这需要克服基因组组装中的独特生物信息学挑战,并确保高质量的测序材料(如组织、血液)。此外,资金短缺,尤其是在低收入国家,使得这些问题更加复杂。在此,我们概述了两栖动物组学面临的挑战,并强调了应对这些挑战的新进展。
两栖动物的大型基因组增加了测序、计算和数据存储的需求与成本。尽管技术进步和服务成本下降,但由于两栖动物基因组显著的内含子长度和重复序列含量,组装这些基因组在方法上仍然具有挑战性,尤其是当重复序列长度超过测序读长时。低复杂度区域可能导致错误连接的contigs,或通过重复序列的collapse造成多达16%的序列信息丢。多倍化现象也在两栖动物中反复出现,这使得特定单倍型的组装变得困难,并可能需要大幅增加测序和计算工作量。因此,长读长测序(如PacBio HiFi、ONT)、光学图谱和3C技术(如Hi-C scaffold)对于组装两栖动物基因组尤为重要。
基因注释与基因组组装同样重要,但目前使用如UniProt等直系同源数据库的基于同源性的方法往往错过或错误注释某些基因,特别是多态基因或缺乏模式物种代表性的基因。这限制了两栖动物在基因进化、重复序列或免疫基因研究方面的进展。
此外,大多数两栖动物的功能基因组学工具(如基因编辑、体外受精和转基因技术)较为稀缺,主要集中在模式物种上(如Xenopus属和Ambystoma mexicanum)。尽管一些两栖动物已经成功生成了永生细胞系,并且为部分无尾类物种建立了自发性细胞系的实验操作方案,但建立大多数物种的细胞培养仍需要广泛的解决方案和专业知识。
大多数用于测序参考基因组的组织采样协议建议从新鲜组织中采集样本,随后立即在液氮中快速冷冻,并在-80°C下保存,直至提取[https://www.vertebrategenomelab.org/resources/guidelines]。这通常需要现场采样,伴随许多后勤挑战。
大多数两栖动物的小体型和血液体积(如< 30克)可能需要进行致死采样,以获取足够的高分子量DNA(HMW,达到100 Kb或超高分子量DNA,达到1 Mb),用于生成参考基因组。虽然这种情况在其他分类群(如无脊椎动物)中也存在,但在两栖动物中进行致死采样可能并不总是合法的或伦理上可取的,特别是对于受威胁物种或圈养个体。非致死采样方法,如口腔拭子或趾(尾)剪除,在各种基因组学应用中越来越具有可行性,包括低覆盖率全基因组测序或靶向测序方法。尽管这些方法尚未适用于参考级别基因组测序,但为了减少采样影响,一种替代方法是使用蝌蚪而非成体进行基因组生成(如生成Taudactylus pleione的基因组)。
利用博物馆或自然历史收藏(新兴领域“馆藏基因组学”)是解决采样难题的一个有前景的研究途径。此外,这还提供了接触过去两栖动物生物多样性的机会,并通过整合名称模式标本的DNA,正在革新两栖动物分类学,克服了如命名法不确定性、物种复合体和隐存物种等障碍。此类研究的关键挑战包括DNA降解、保存方法和污染问题,这些问题需要克服。对于湿法保存的两栖动物标本而言,这尤为重要,因为获取DNA可能因未记录的固定和保存方法而变得困难,可能影响核苷酸的完整性。实验方案中的方法学以及“Barcode Fishin”等测序策略的发展,已经在应对这些挑战方面取得了显著进展,包括测序已灭绝物种的能力。在当前时代,即便是从分类模式标本中获取的有限序列,对于那些使环境DNA(eDNA)和宏基因组学等方法进行物种鉴定的研究者来说,仍具有无与伦比的重要性。
其他值得注意的挑战,虽然不一定是两栖动物独有的,但包括获得采集和研究许可证,保持超低温储存和运输过程中的冷链不中断,以及遵守跨境运输生物样本的相关规定。然而,由于两栖动物的生物学、生态学和保护特征,也可能出现特定的挑战。两栖动物多样性和特有种中心包括偏远且高度专业化的栖息地,如热带山地森林、洞穴系统或孤立的湿地。此外,许多两栖动物具有专门的水生、地下或树栖生态,大多是夜行性且高度季节性。这些因素使野外工作和样本运输变得极具挑战性,尤其是在基础设施差、储存设施不足、存在社会政治冲突及科研、保护和公众意识资金有限的地区。
尽管消除两栖动物野外工作中某些实际和政治挑战超出了个别研究者的能力范围,但随着基因组数据的可获得性日益提高,人们应更加关注公平和公正获取遗传资源的原则,这些原则由《生物多样性公约》(CBD)提出,并在《名古屋议定书》中得到进一步阐述(https://www.cbd.int/abs/default.shtml)。当地人民和当地社区(IPLC)通常是研究人员所寻求的遗传资源(物质资源)的管理者,因此在开始基因组学项目之前,所有相关方必须就获取和惠益分享(ABS)达成合作和公平的协议。
两栖动物基因组联盟(AGC)的目标、优先事项和架构
AGC(https://mvs.unimelb.edu.au/amphibian-genomics-consortium)于2023年3月启动,旨在通过技术进步和国际合作来解决上述知识空白。AGC的使命是促进两栖动物研究人员之间的国际和跨学科合作,扩大两栖动物的基因组资源,并有效利用基因组数据和功能资源,缩小基因组生物学家、科学家与保护实践者之间的差距。AGC的领导层包括一名主任、两名副主任和一个由10名成员组成的董事会。董事会成员的选择经过精心考虑,以确保性别平等、科学学科的多样性、职业阶段的不同以及来自不同地理区域的代表性。
AGC的首批行动包括每月定期会议,展示两栖动物基因组学研究的进展,开发技术资源和最佳实践指南(通过在Discord频道中进行的讨论),改进两栖动物基因组注释,支持学生和早期职业研究人员的差旅,举办网络会议活动,并进行虚拟和线下的计算工作坊。有关这些活动的详细信息可以在AGC网站上找到。AGC计划获得资金,以测序高优先级的两栖动物物种(参见AGC的基因组测序目标部分和表1)。此外,AGC还旨在促进为更广泛的分类联盟收集两栖动物样本。AGC已经与地球生物基因组计划(EBP)和AmphibiaWeb(https://amphibiaweb.org)建立了合作关系,进一步加强了其推进两栖动物基因组学和保护工作努力的承诺。
AGC成员情况
截至本文提交时,AGC拥有来自41个国家的282名成员(非洲6名,美洲131名,亚洲27名,大洋洲29名,欧洲89名),并且成员人数仍在不断增加(见图4)。虽然成员在地理上具有多样性,但不同地区之间仍存在差距。AGC将重点招募来自代表性不足国家的成员,尤其是在两栖动物多样性高或特有性高的地区,如中美洲、南美洲和东南亚。我们通过为来自发展中国家和代表性不足群体的成员提供额外的支持和机会来促进成员之间的公平。这包括免除会员费、轮换在线会议时间以适应全球时区、在基于云的协作平台Discord上建立讨论小组,并将AGC的交流翻译成多种语言。此外,我们还致力于促进全球新兴科学家之间的知识和技能转移,积极鼓励早期职业研究人员加入该项目并参与管理工作。
图4 AGC成员的分布
AGC成员对基因组技术的当前使用情况和看法
AGC领导层设计了一份包含23个问题的调查问卷,以调查联盟成员在两栖动物基因组学方面的经验(问题见补充表S1)。该调查通过Qualtrics XM平台分发,并于2023年3月4日至12月27日期间进行。我们共收集了来自32个国家的133名AGC成员的回复,这些成员具有不同的测序方法和生物信息学技术专长,主要从事无尾目两栖动物的生态与进化研究。总体而言,受访者强调了由于当前的保护危机,填补两栖动物基因组学知识空白的紧迫性,指出有必要扩大高质量染色体级别两栖动物基因组的数量。此外,受访者普遍认为,生成新的基因组资源需要与改进和提高基因组注释过程的可及性相结合。受访者还强调了在国际范围内共享计算专长和资源的重要性。超过一半的调查参与者表示他们在研究中使用了测序技术(133人中有70人)。大约一半的受访者表示,他们的主要工作活动是“基因组实验室工作”或“计算分析”(分别为48%和57%)。
为评估联盟成员在两栖动物基因组学方面的经验,我们对定量回答进行了主成分分析。AGC受访者的生物信息学能力和感知到的挑战分别归为两个维度(图5A和图S2;方法信息参见补充材料)。为了解释这两个新变量的变化,我们使用了AGC成员的科学专长、获得资助的成功率以及与受访者主要隶属国家相关的两个变量:两栖动物物种数量和人均研发经费(GERD)作为解释变量。受访者在两栖动物基因组学方面的专长和识别的挑战存在显著差异。受访者所在国家的两栖动物物种数量和人均GERD并未解释这种差异(图5B和图S3;方法信息参见补充材料)。相反,基因组学研究的资助成功率和科学专长的年限与预期一致呈正相关,且这两个变量均与感知到的两栖动物基因组学相关挑战的减少有关。
图5 测序能力与AGC成员的面临的挑战
AGC的基因组测序目标
继其他四足动物类群基因组联盟的努力工作之后,并基于之前的研究,我们确定了48个尚未测序的代表性基因组的两栖动物科,并从每个科中选出一个代表物种作为我们的测序优先名单(图2B和表1)。我们基于IUCN红色名录分类、生态和进化独特性以及其他基因组学记录(特别是转录组学)的可用性提出了48个候选物种。这份名单包括38个无尾目物种、4个有尾目物种和6个蚓螈物种。
我们建议将此优先列表作为起点。如果目标科中的其他物种有合适的样本材料可供使用,这些物种可以替换目前提出的物种。此外,我们还旨在建立在现有基因组联盟(如脊椎动物基因组计划(VGP))的基础上,因此我们在测序目标名单中包括了两种在GenomeArk(https://www.genomeark.org/)中具有草稿基因组的物种。
AGC关于资源和利益分享的立场
随着基因组数据获取的日益便捷,研究人员和相关行业需要意识到《生物多样性公约》(CBD)中规定的关于遗传资源公平和公正获取的原则,以及《名古屋议定书》对这些原则的进一步阐述(https://www.cbd.int/abs/default.shtml)。两栖动物领域的一个负面例子是,亚马逊土著居民传统使用的巨人猴树蛙(Phyllomedusa bicolor)的皮肤分泌物被美国、日本、俄罗斯等国家的相关人士申请了专利,导致这种遗传资源及其背后的传统知识从Matses族及其他土著部落哪里被“合法”但不公平地窃取。
为促进更好的实践,研究人员在规划野外工作时应预留足够的时间和资金进行事先咨询,并从其国家ABS(获取和惠益分享)联络点获取指导。ABS的概念如何应用于生成的数字序列信息(DSI)的下游使用尚未得到解决。然而,目前正在进行的一些开发工作可能会提供解决方案(https://www.cbd.int/dsi-gr)。未来必须考虑这一问题。此外,凭证标本和重复组织样本应存放在当地的自然历史收藏机构或当地社区的首选合作伙伴中。
全球基因组学界应努力确保测序项目在样本原产国进行,避免“降落伞式科学”或“直升机式科学”。牛津纳米孔技术(ONT)可能是一个有前景的解决方案,提供了相对可负担的超长读长测序设备和试剂,甚至可以直接在野外进行。然而,针对非模式生物的优化,以及基础设施的启动成本,仍对许多低收入国家的科学家构成了障碍。未来的目标应该是与当地研究人员合作应用这些技术。In Situ Laboratories Initiative(https://insitulabs.org/hubs/)等项目旨在通过在偏远生物多样性丰富地区提供高科技实验室的经济实惠访问来克服这些挑战。此类合作项目应从发现共同利益、开发想法、实现研究成果的共享利益并专注于能力建设的工作方面展开。
结论与行动号召
展望未来,AGC承诺支持全球范围内的两栖动物测序计划,特别强调在保护框架内缺乏代表的分类群和来自生物多样性丰富国家的物种(表1)。只要可行,在当地开展的测序计划将优先进行,以促进原地研究工作的开展和设施的发展。我们将通过在研究人员和保护实践者之间建立强大的网络,并提供成员及其专长的公开名单来实现这一目标。此外,我们还将提供资金和培训机会,促进代表性不足群体、分子和生物学家、生物信息学家以及保护实践者之间的合作。我们还将支持获取和惠益分享(ABS)政策概念的发展,该政策可以应用于数字序列信息(DSI)的下游使用,包括长期存储和访问。此外,AGC还希望激发公众和科学界对两栖动物研究的兴趣,并最终提高对这一引人注目且高度濒危的脊椎动物类群的保护成果。
我们希望,随着技术的最新进展、对公平研究的关注以及研究社区的整合形成的AGC,能够激发革命性的两栖动物的保护研究,并深化我们对其迷人的生物学、生态学和进化的理解。通过解决所列出的挑战,支持和促进两栖动物基因组学研究,并团结全球的两栖动物研究人员,AGC旨在填补这一多样化四足动物类群基因组数据的巨大空白,并借此推动两栖动物基因组学研究迈向新未来。
Citation
The Amphibian Genomics Consortium: advancing genomic and genetic resources for amphibian research and conservation
Tiffany A. Kosch, María Torres-Sánchez, H. Christoph Liedtke, Kyle Summers, Maximina H. Yun, Andrew J. Crawford, Simon T. Maddock, Md. Sabbir Ahammed, Victor L. N. Araujo, Lorenzo Vincenzo Bertola, Gary M. Bucciarelli, Albert Carné, Céline M. Carneiro, Kin O. Chan, Ying Chen, Angelica Crottini, Jessica M. da Silva, Robert D. Denton, Carolin Dittrich, Gonçalo Espregueira Themudo, Katherine A. Farquharson, Natalie J. Forsdick, Edward Gilbert, Jing Che, Barbara A. Katzenback, Ramachandran Kotharambath, Nicholas A. Levis, Roberto Márquez, Glib Mazepa, Kevin P. Mulder, Hendrik Müller, Mary J. O'Connell, Pablo Orozco-terWengel, Gemma Palomar, Alice Petzold, David W. Pfennig, Karin S. Pfennig, Michael S. Reichert, Jacques Robert, Mark D. Scherz, Karen Siu-Ting, Anthony A Snead, Matthias Stöck, Adam M. M. Stuckert, Jennifer L. Stynoski, Rebecca D. Tarvin, Katharina C. Wollenberg Valero, Amphibian Genomics Consortium (AGC)
doi: https://doi.org/10.1101/2024.06.27.601086