近年来,植物细胞遗传学和基因组学领域的研究取得了巨大进展,相关出版物的数量飞速增长。为了简化对分散数据的获取,在线数据库、资源库和分析工具的数量也随之增加。本文对这些资源进行了全面的概述,对于相关领域的研究人员来说极具参考价值。其内容涵盖了染色体数目、特殊染色体(如B染色体或性染色体)数据库(部分为面向特定类群的数据库)、基因组大小数据库、细胞遗传学以及用于基因组分析和可视化的在线应用程序和工具等。
过去几十年,植物细胞遗传学和基因组学相关领域的飞速发展,导致了相关主题出版物数量几乎呈指数级增长。这一现象引发了对分散在文献中的特定数据进行简化和便捷获取的需求。此外,技术的进步也推动了数据生成速度的增加,并催生了对分析这些海量新信息工具的需求。因此,汇集植物细胞遗传学和基因组学数据的在线数据库、数据资源库和分析工具的数量也有了显著增长。
本文展示了一系列精心挑选的在线数据库、资源库和工具,旨在为对植物细胞遗传学和核型分析感兴趣的研究人员提供参考。我们意识到这份选择是主观且不完全的,因此鼓励读者在需要时进一步深入探索。所有资源均为开放获取,并且本文所提供的所有超链接截至2021年8月均可访问。
数据库作为从定向文献搜索中汇集信息并提供其来源的一种工具,已从简单的索引发展而来,能够更加轻松、有序、快速地访问不同类型的信息。其重要性在于数据获取的便捷性,但其价值往往受到更新频率和维护状况的限制,通常依赖于个别研究团队及其资金支持。在植物细胞遗传学领域,存在广泛的此类资源,我们在此列出了一些较为重要的数据库。
为便于阅读,我们根据数据库的主要研究主题(染色体、基因组大小、细胞遗传学等)对其进行了分类,但需要说明的是,由于部分数据库所涵盖的信息内容广泛且多样,它们可能同时适用于多个类别。此外,最后一个部分(杂项)实际上是一些以PDF格式呈现的列表。尽管这些资源未必完全符合数据库的标准,我们仍将其列出,因为它们可能对研究有所帮助。
染色体数目与特殊染色体
染色体数目数据库/The chromosome counts database (CCDB)
http://ccdb.tau.ac.il/
B染色体数据库/B-chrom database
http://www.bchrom.csic.es
B-chrom数据库收集了有关植物、动物和真菌中B染色体的已发表数据,这是巴塞罗那植物研究所的研究人员、图书管理员及其合作伙伴共同努力的结果。该数据库包含超过5700条记录,支持按物种、属、科、目或纲进行搜索。此外,它还提供染色体数目和倍性水平的信息。下一次更新将很快发布。
性染色体数据库/Sex-chrom database
https://www.sexchrom.csic.es/
该数据库提供了从1919年至2020年有关植物性染色体的已发表信息,不仅涵盖了性染色体的形态或类型等一般特征,还包括了关于性染色体上遗传元件的更具体信息,如针对某些物种的重复DNA或特定基因。该资源包含总计431条记录,涉及173个物种,由巴塞罗那植物研究所及捷克共和国生物物理研究所的研究人员、图书管理员和技术人员共同制作,并且已进行了最近的更新。
植物染色体数目索引/Index to Plant Chromosome Numbers (IPCN)
http://legacy.tropicos.org/Project/IPCN
IPCN(国际植物染色体数目数据库)于20世纪50年代由加利福尼亚大学创建,经过其他机构的接管后,最终由密苏里植物园托管,直至2010年。据我们所知,该数据库现已不再更新。自1979年以来,该数据库收集了超过10万条关于天然和栽培物种及品种的染色体数目数据,这些数据已在不同的索引中发表。
英国及爱尔兰植物学会:细胞遗传学数据库/Botanical Society of Britain and Ireland: the cytology database
https://websites.rbge.org.uk/BSBI/cytsearch.php
英国和爱尔兰植物学会的网站包含一个细胞学数据库,其中收录了2746条有关英国群岛(包括维管植物和轮藻类)的本土和外来野生植物材料的染色体数目数据。该数据库提供了一个专门的查询表单,支持按分类群名称、地区或县进行搜索,并提供额外的输出和排序选项。
Prota4U
https://www.prota4u.org/database/
由瓦赫宁根大学主导的“热带非洲植物资源”(PROTA)是一个国际项目,拥有广泛的机构和合作伙伴网络,覆盖20个非洲国家。该项目到2013年已收集了关于8000种非洲有用植物的科学信息,其中一些植物包含染色体数目数据。其目标是促进热带非洲的生物多样性,并支持这些资源的利用,以改善当地经济。
德国植物染色体数目数据库/Chromosome numbers of the flora of Germany
http://chromosomes.senckenberg.de/karyodb/page2_ search.html
这是由Paule等人在莱布尼茨生物多样性与地球系统研究所开展的一个项目,专注于德国植物区系中的蕨类植物和种子植物,并包含染色体数目和倍性水平数据(通过流式细胞术估算)。该数据库持续更新,截至2021年8月,共有14,248条记录。
斯洛伐克蕨类与有花植物细胞核型数据库/Karyological database of the ferns and flowering plants of Slo-vakia
https://www.chromosomes.sav.sk/main/index.php? lang=en
通过该搜索引擎,我们可以找到斯洛伐克本地和外来蕨类植物及被子植物的染色体数目数据,包括杂交分类群。搜索时可以根据与分类学、分布位置和相关文献等不同标准进行查询。该数据库包含7463条染色体数目记录,是之前染色体数目调查的在线版本。
面向特定类群的数据库
菊科染色体数目索引/Index to Chromosome Numbers in Asteraceae
http://www.lib. kobe-u.ac.jp/infolib/meta_pub/engG0000003asteraceae
2008年,日本神户大学的Watanabe教授创建了这一在线工具,用户可以通过该工具搜索有关菊科(Asteraceae)的出版物,其中包括已观察到的染色体数目。在Semple & Watanabe的研究中,对该数据库的主要发现进行了总结。该数据库正在持续更新。
十字花科庭荠族数据库/AlyBase
https://www.alysseae.sav.sk/
该数据库包含从科学出版物中收集的属于十字花科(Brassicaceae)糖芥族(Alysseae)的780条物种记录数据。用户可以查询到染色体数目和倍性水平,同时还提供了其他信息,如分类学、采集地点、模式标本及出版期刊等。
山柳菊属已发表染色体数目数据库/Published chromosome counts in Hieracium
http://www. botanischestaatssammlung.de/projects/chrzlit.html
来自巴伐利亚州立自然科学博物馆(SNSB)的Franz Schuhwerk博士编制了一份关于至1996年5月已发表文章中316条有关山柳菊属(Hieracium)物种染色体数目的表格。
锦葵科染色体数目数据库/ Chromosome Counts for Malvaceae
http://www.malvaceae.info/Biology/Chromosomes.php
“Malvaceae Info”网站提供锦葵科的植物学和园艺信息,其中一个部分包含锦葵科物种的943条染色体数目记录,并注明了相应信息的来源。
世界滇紫草属已发表染色体数目数据库/ Worldwide database of published Chromosome Numbers in Onosma
http://www.onosma.eu/database/
该数据库包含153条记录,可用于查询至2013年间科学出版物中报道的滇紫草属(Onosma,紫草科)物种的染色体数目。
基因组大小与流式信息
植物DNA C值数据库/Plant DNA c-values database
https://cvalues.science.kew.org/
这是由英国皇家植物园(Kew)提供的最重要的在线科学资源之一,包含了12,273条被子植物、裸子植物、蕨类植物、苔藓植物和藻类的基因组大小数据。数据库提供了多种排序选项,例如染色体数目、倍性水平、估算方法以及其他生物学和技术特征。该数据库定期更新,最近一次更新是在2019年。
巴尔干半岛植物区系基因组大小数据库/Genome size of Balkan flora (GeSDaBaF)
http://gesdabaf.pmf.unsa.ba/
该网站由巴黎萨克雷大学、法国国家科学研究中心(CNRS)和萨拉热窝大学联合维护,提供了来自1013个采集样本的基因组大小数据,全部样本来自巴尔干地区,涵盖了约8.50%的已知巴尔干植物区系。除了原始来源参考外,该网站还显示染色体数目、倍性水平以及采集国家等数据。
菊科基因组大小数据库/Genome size in Asteraceae database
https://www.asteraceaegenomesize.com/
该数据库目前汇总了来自198篇文献的1555个菊科物种(Asteraceae)的基因组大小数据。此外,还提供染色体数目、倍性水平、流式细胞术的测量方法或内参标准等信息(若有)。该数据库由EtnoBioFiC(植物系统分类、系统发育与分子细胞遗传学及民族植物学)首次发布,研究团队由巴塞罗那植物研究所和巴塞罗那大学的研究人员组成。最近一次更新是在2019年。
有花植物流式数据库/Flower database—a database on flow cytometry
https://botany.natur.cuni.cz/flower/
该数据库于2008年发布,虽然此后停止更新,但由于其技术方法,仍然是一个有用的资源。它提供了关于流式细胞术的技术数据(如缓冲液、标准物、变异系数范围等),涵盖了826篇文章中涉及的3528个植物物种。
细胞遗传学
植物rDNA数据库/Plant rDNA Database
https://www.plantrdnadatabase.com/
该数据库专注于荧光原位杂交(FISH)rDNA信号,提供了关于5S和18S-5.8S-26S基因的数目和染色体位置的信息,同时还涵盖了rDNA排列、染色体数目、倍性水平、基因组大小和端粒类型等数据。目前的版本包含3783条记录,涉及2148个物种,这些数据来自785篇文献。自2012年以来,该数据库由EtnoBioFiC研究团队的研究人员和技术人员维护,最近一次更新是在2017年,下一次更新正在进行中。
智利植物细胞遗传学数据库/Chilean Plant Cytogenetic Database
https://chileanpcd.com/
智利植物细胞遗传学数据库是一个包含402种智利植物的全面数据库(包括95种苔藓植物、24种蕨类植物、4种松柏植物和279种被子植物),其中包含染色体数目(2n)、核型形态、基因组大小、带型模式以及FISH(荧光原位杂交)信息等数据。
印度植物基因组相关信息数据库/Database on Genome Related-Information of Indian Plants (dGRIP)
http://sbtju.in/Dgrip/index.html
dGRIP 是一个植物数据库,提供基因组大小、染色体数目、倍性水平及其他分子细胞遗传学和系统分类信息。该数据库专注于印度植物(包括被子植物、裸子植物、蕨类植物和苔藓植物),目前包含约1500个物种的信息。
巴西植物细胞遗传学数据库/The Cerrado (Brazil) Plant Cytogenetics Database
http://cyto.shinyapps.io/cerrado/
CerradoCyto——植物细胞遗传学特征应用程序是一个基于网络的服务,使用R语言开发,提供关于科学计量学(技术、作者、研究工作等)、染色体数目、基因组大小以及有关巴西塞拉多地区植物多样性的一些统计数据。
杂项
夹竹桃科细胞遗传学数据库/A karyological survey of Asclepiadoideae, Periplocoideae, and Secamonoideae, and evolutionary considerations within Apoc-ynaceae s.l.
https://www.jstor.org/stable/3298637?origin=crossref
本报告记录了从文献中提取的夹竹桃科(Apocynaceae)中萝藦亚科、杠柳亚科和鲫鱼藤亚科740个分类群中的672个物种的染色体数目。其中299个分类群的染色体数目为首次发表,139个新的数目数据验证或补充了之前已发表的文献。
新西兰维管植物染色体数目数据库/ Index of chromosome numbers of indigenous New Zealand vascular plants
https://www.landcareresearch.co.nz/uploads/public/researchpubs/chromosome2008.pdf
一份未发表的报告列出了新西兰本土维管植物的染色体数目,包含有关蕨类植物和种子植物的染色体数目信息。该报告涵盖了大约80%的新西兰本土植物区系。
捷克维管植物基因组相关信息数据库/ Genome sizes and genomics guanine+cytosine (GC) contents of the Czech vascular flora with new estimates for 1700 species
http://www.preslia.cz/P192Smarda.pdf
该数据库汇总了与基因组大小和GC含量相关的基因组数据信息。数据库报告了分布在捷克共和国的1700种维管植物的1908个样本。此外,这是首个报告超过1500种植物GC含量信息的数据库。该数据库中分析的植物区系约83%为该国的常见物种,不包括无融合生殖种。
毛茛科翠雀族染色体数目数据库/ DCDB: An updated online database of chromosome numbers of the tribe Delphinieae (Ranunculaceae)
http://hdl.handle.net/2445/95875
DCDB是一个包含1097份报告的数据库,涉及327个物种,提供了对翠雀族(Delphinieae)染色体数目信息,其中包括乌头属(Aconitum)、飞燕草属(Consolida)和小乌头属(Aconitella)。该数据库的数据代表了翠雀族大约40%的物种。
意大利植物染色体数目数据库/CHROBASE—Chromosome numbers for the Italian flora (CHROBASE)
http://bot.biologia.unipi.it/chrobase/index.php
该网站包含3130个意大利和科西嘉的分类群的倍性水平和染色体数目信息,数据来自1598篇文献。网站将数据与采样地点一同展示,并允许根据地区或研究作者进行筛选。该资源由Bedini等人自2010年起维护。
碎米荠属核型数据库/Karyological database of the genus Cardamine (CardaBase)
http://www.cardamine.sav.sk/www/index.php?lang=en
该网站主要关注十字花科(Brassicaceae)的碎米荠属(Cardamine),但也包含了碎米荠族的其他记录。它基本上是一个当前公认名和异名查询的指南,但同时也包含3701条染色体数目、750条倍性水平和150条基因组大小的记录。该资源最初由Kucera等人于2005年发布,目前由Marhold等人自2021年起维护。
分析工具
如今,众多可用的分析工具使我们能够以过去认为过于困难甚至不可能的方式来组织、检查和可视化数据。这些工具的生命周期主要取决于研究人员的需求,其特定的相关性可能是短暂的,也可能随着时间的推移而保持长期的影响。尽管当前大多数可用的数据、协议和分析工具主要集中在人类、动物或酵母的研究上,但专门为这些生物设计的软件和资源库在某些情况下也可以应用于植物细胞遗传学。此外,这些工具大多数是开源的,因此团队有机会根据自己的需求对软件进行调整和适配。本文列出了一些可能应用于植物细胞遗传学研究的最相关的分析工具和资源库。
在线服务和工具
Argussoft
http://argussoft.org/en/karyotyping-software/
这是一个用于根据带型位置进行人类染色体核型分析的软件,虽然它也适用于其他动物和植物。该网络服务适用于植物研究,包括FISH分析、核型分析和形态测量。
Genomicus Plants
https://www.genomicus.bio.ens.psl.eu/genomicus-plants-41.01/cgi-bin/search.pl
Genomicus Plants 使用户能够在多个维度上浏览基因组:沿染色体轴、跨越不同物种的横向比较以及沿进化时间的纵向分析。该软件可以在核型或系统基因组学背景下比较多个基因组。分析可用于66个现存物种(来自EnsemblPlants),涵盖总计2,120,850个现存基因。
K-Masker
https://kmasker.ipk-gatersleben.de/
K-Masker是一款应用程序,允许通过高通量序列reads检测基因组中的重复区域。K-Masker的源代码可公开获取,地址为:https://github.com/tschmutzer/kmasker。该工具能够自动检测具有重要k-mer特征的序列区域,这些区域可能是具有高丰度k-mer模式的序列(重复区域)、在两个研究的全基因组测序(WGS)样本之间存在k-mer模式差异的区域,或具有高度特异性的片段。
MOGEN:3D基因组重建
http://calla.rnet.missouri.edu/mogen/
MOGEN 3D基因组重建是一款开源软件,利用Hi-C染色体构象捕获数据对基因组的3D结构进行建模。它生成两种类型的输出文件:(i) PDB格式(蛋白质数据库,https://www.rcsb.org/)的3D模型;(ii) 包含模型中每条染色体的接触和非接触得分的文本文件。
GMOL 2–3D基因组结构可视化
https://mybiosoftware.com/gmol-3d-genome-structure-visualization.html
GMOL 2是一款用于三维可视化基因组结构的工具。该软件允许在多个尺度上可视化基因组结构,包括全局、染色体、基因座、纤维、核小体和核苷酸级别。
WALTER(端粒长度在线分析工具)
https://www.ceitec.eu/chromatin-molecular-complexes-jiri-fajkus/rg51/tab?tabId=125
这是由中欧技术研究所(CEITEC)开发的在线工具,能够通过将这些序列区域转化为强度曲线图,然后将结果绘制为箱线图或小提琴图并进行统计分析,以分析端粒末端限制片段。
EyeChrom和CCDBcurator:可视化植物染色体数目数据
https://bsapubs.onlinelibrary.wiley.com/doi/10.1002/aps3.1207
这些工具以多种格式汇总和显示来自染色体数目数据库(见上文)中所选属或物种集的染色体计数数据。更多关于如何使用和下载EyeChrom和CCDBCurator的详细信息,请参见Rivero等人(2019)。
4DN软件
https://www.4dnucleome.org/software.html
这是4DN Nucleome Network(https://www.4dnucleome.org/)的工具资源库。这些工具允许对基因组图谱或DNA序列、染色质相互作用或染色质蛋白信息进行深入分析,使用的数据包括3C、4C、5C、Hi-C、ChIA-PET等。该网站还提供染色体构象捕获技术的实验指南、社区联系、新闻和出版物记录等资源。
A non-exhaustive list of methods for 3D genomics
http://sgt.cnag.cat/3dg/methods/
西班牙国家基因组分析中心(CNAG)资源库保留了他们自己的和其他3D基因组分析工具。它们使用3C、4C、5C或Hi-C数据进行染色质相互作用分析、三维结构建模、映射或图形表示。
Epigenie
https://epigenie.com/epigenetic-tools-and-databases/
这是Epigenie团队(https://epigenie.com/)创建的一个资源库,专注于表观遗传学,包含:(i) 用于甲基化、染色质免疫沉淀测序和RNA-seq数据的分析工具;(ii) 下游分析和可视化工具,涵盖基因本体和通路、基序识别、亚硫酸氢钠引物设计以及其他基因组分析工具;(iii) 表观遗传学数据库,一些是综合性的,一些则专注于染色质、DNA甲基化或非编码RNA。
Ensembl Genomes 2016:更多基因组,更多复杂性
https://plants.ensembl.org/index.html
这是一个在线基因组组装浏览器,提供可视化核型、浏览基因组区域直到核苷酸水平的功能,还可进行比较和系统发育分析、查看序列水平的变异性、基因剪接变体、调控数据等。所有功能都有适当的参考文献,并为用户提供访问权限。目前,它提供来自94种具有经济或科学意义的植物物种的114个组装基因组的数据。
Cite this protocol
Gutiérrez, M.L., Rodríguez-González, R., Pascual-Díaz, J.P., Fuentes, I., Garcia, S. (2023). Online Resources Useful for Plant Cytogenetics and Cytogenomics Research. In: Heitkam, T., Garcia, S. (eds) Plant Cytogenetics and Cytogenomics. Methods in Molecular Biology, vol 2672. Humana, New York, NY.
https://doi.org/10.1007/978-1-0716-3226-0_33