NCBI数据库:生物信息学领域的权威存在呢!它全称美国国家生物技术信息中心(National Center for Biotechnology Information),隶属于美国国立卫生研究院的国立医学图书馆。NCBI数据库收录了全世界所有实验室测序过的核酸信息,包括“人类基因组计划”测序结果、小鼠等所有物种的测序信息。它还提供许多功能强大的数据检索与分析工具,比如BLAST、COBALT等,可以帮助用户对大量数据进行快速准确的分析。NCBI数据库包含多个子数据库,如GenBank核酸序列数据库、PubMed文献数据库等。在NCBI数据库中,你可以找到大量的生物信息学数据,包括DNA和蛋白质序列、基因组组装、基因注释、蛋白质结构等。这些数据对于生物学家和医学研究者来说非常重要哦!
GEPIA数据库(Gene Expression Profiling Interactive Analysis):基于基因表达水平值的交互式分析平台,由北京大学张泽民教授团队开发。该平台无需编程背景,就可以通过R、Perl等语言对数据进行处理、可视化,为科研工作者提供了便捷的癌症大数据分析服务。
UALCAN数据库:一个全面的、用户友好的交互式网络资源,用于分析癌症组学数据。它提供了对公开的癌症组学数据的方便访问,允许用户识别生物标志物或验证潜在感兴趣的基因。
GEO数据库(Gene Expression Omnibus):由美国国立生物技术信息中心(NCBI)创建并维护的基因表达数据库,收集了来自全球各国研究机构的基因表达数据,这些数据涵盖了肿瘤、非肿瘤等多个领域,且都是公开免费的。
TCGA数据库(The Cancer Genome Atlas):一个由美国国立癌症研究所(NCI)和国立人类基因组研究所(NHGRI)联合发起的国际性癌症研究项目所建立的数据库。该项目旨在通过全面、系统地研究多种类型癌症,揭示癌症的分子机制,并为癌症的早期诊断、治疗策略的制定和药物的研发提供重要的数据支持。
DAVID数据库(the Database for Annotation,Visualization and Integrated Discovery):一个生物信息数据库,同时也是一款在线免费分析软件。它整合了生物学数据和分析工具,为大规模的基因或蛋白列表提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。
gnomAD数据库:一个由国际研究人员联盟开发的基因组突变频率数据库。它旨在汇集和协调来自众多大规模测序计划的全外显子组和全基因组测序数据,为广泛的科学研究团体提供汇总数据。
GlinGen数据库:一个专注于基因型与表型关联信息的数据库,它旨在整合和分析基因变异与人类疾病之间的关系。
DECIPHER数据库:一个基于网络的交互式数据库,由英国威康桑格研究所建立,现由欧洲生物信息学研究所托管。该数据库专注于收集、整合并解释基因组变异信息,特别是拷贝数变异(CNV)和序列变异(SNV),以帮助医生和遗传咨询师更好地识别和诊断罕见病。
GenBank:由美国国家生物技术信息中心(NCBI)维护的一个公共基因序列数据库,提供全面和权威的基因序列数据、注释和相关工具。
Ensembl:由欧洲生物信息学研究所(EBI)和Wellcome Trust Sanger Institute联合开发的一个集成基因组信息的数据库,提供高质量的、经过详细注释的基因组数据。
UCSC Genome Browser:加州大学圣克鲁兹分校的基因组浏览器,提供了丰富的基因组数据和可视化工具,允许用户方便地浏览、检索和分析基因组数据。
DDBJ:DNA Databank of Japan(DDBJ)是日本的公共核酸序列数据库,作为国际核酸序列数据库联盟(INSDC)的一部分,与GenBank和EMBL-EBI数据共享。
EBI:欧洲生物信息学研究所(EBI)是全球领先的生物信息学研究和数据资源中心,提供包括基因组、转录组、蛋白质组等多种生物数据。
RefSeq:由NCBI管理的参考序列数据库,提供标准化的核酸和蛋白质序列数据。
KEGG:一个包含生物信息学数据库和相关工具的综合性资源,旨在帮助理解生物系统的功能和组成,包含了多种生物信息学数据,包括基因组、代谢途径、疾病和药物等信息。
NR(Non-Redundant Protein Database):一个非冗余的蛋白质数据库,由NCBI创建并维护,内容比较全面,涵盖了广泛的生物物种,包括细菌、真菌、植物、动物等。
Pfam:一个大型的蛋白质家族集合,其中每个家族都由多序列比对和隐马尔可夫模型(HMMs)来表示。
KOG(euKaryotic Orthologous Groups):真核生物的直系同源蛋白数据库,它是由NCBI创建并维护的。
EggNOG(evolutionary genealogy of genes:non-supervised orthologous groups):由EMBL创建并维护的直系同源蛋白分组比对数据库,它是对NCBI的COG数据库的拓展。
Swissprot:经过注释的蛋白序列数据库,由欧洲生物信息学研究所(EBI)维护。每个条目包含蛋白质序列、引用文献、分类学信息和详细注释等。
TrEMBL:UniProt(Universal Protein Resource,通用蛋白质资源)数据库的一部分,包含了大量的蛋白质序列,这些序列主要是通过计算机预测或从核酸序列翻译而来,其注释信息相对较少。
STRING:一个用于检索已知蛋白和预测蛋白之间相互作用的综合性数据库。
UniProt(Universal Protein):一个信息丰富、资源广泛的蛋白质数据库,它由Swiss-Prot、TrEMBL和PIR-PSD三大数据库的数据整合而成。
ClinVar:一个免费访问的公共数据库,记录了人类变异和表型之间的关系,并提供了支持性证据。ClinVar可处理用户提交的病人样本变异检测报告、变异临床意义的判读、提交者的信息和其他支持数据。ClinVar将提交的等位基因映射到参考序列,并按照HGVS标准进行报告。
OMIM:一个不断更新的人类孟德尔遗传病的数据库。数据库主要记录人类基因变异和表型性状之间的关系。目前仍在更新维护,并免费对外提供查询,也可以提交信息进行数据申请。OMIM 由约翰·霍普金斯大学医学院 McKusick-Nathans 遗传医学研究所在 Ada Hamosh 博士的指导下撰写和编辑。
人类基因突变数据库:The
Human Gene Mutation Database, HGMD,是通用型数据库的代表, 它全面收集引起人类遗传疾病或与人类遗传疾病相关的核基因突变。此数据库建立的初衷是用于突变机制的分析,但由于它收录最新的、完整的有关人类疾病突变谱的参考数据,HGMD至今已获得了更为广泛的应用。HGMD 收集的数据包括了单碱基置换(比如编码序列中的错义突变和无义突变以及调控和剪切区域中的点突变)、微缺失和微插入、缺失/插入、重复序列扩增以及大的基因损伤(缺失、插入和培增)和复杂的基因重组。
GeneCards:一个专门提供人类基因全面信息的数据库,整合了来自多个权威来源的数据,包括NCBI、UCSC、Ensembl、Uniprot等近200个网站的信息。它涵盖了基因组学、转录组学、蛋白质组学、遗传学、临床研究及功能数据等内容。GeneCards数据库收录了超过46万个基因信息,其中包括超过2万个与疾病相关的基因,能够为研究者提供全面的基因相关数据,极大地简化了基因研究过程。
HPO数据库:全称为人类表型组数据库,即Human Phenotype Ontology(HPO),是一个专门用于描述人类疾病表型的数据库。HPO数据库中每一个表型数据都包括了详细的描述信息,如定义、表现形式、发生频率、相关的基因、变异类型、临床特征、发病机制等,可以帮助研究者更深入的理解疾病的发生发展过程。HPO数据库包含与已知基因和疾病的关联信息,这对于探索基因与表型之间的关系至关重要。例如,某个基因突变可能与特定表型(如心脏病)相关。
GISAID:一个全球性的流感病毒基因数据共享平台,旨在促进全球范围内的流感病毒基因组数据的分享和合作研究。研究人员可以在GISAID数据库中找到大量的流感病毒基因组序列数据,这些数据对于流感病毒的研究、监测和疫苗开发具有重要意义。
1000 Genomes Project:是目前最大的完全开放的全基因组测序(WGS)数据资源,被广泛用于基因型插补、绘制表达定量性状基因座、高通量测序结果中过滤非致病性变异,以及群体结构和分子进化的遗传分析等研究工作中。2015年,1kGP项目团队针对来自26个种群的2,504个无亲缘关系样本进行低覆盖度全基因组测序,发布了1kGP Phase3的变异集合,包括8,470万个单核苷酸变异(SNVs),360万个短插入和缺失(INDELs),以及68,818个结构变异(SVs)。
Gramene:一个开源的,通过比较功能基因组学整合数据资源的网站。这里面罗列了不同水稻亚种的基因组信息,包括普通野生稻Oryza rufipogon,印度野生稻Oryza nivara,非洲栽培稻Oryza glaberrima等等。现在我获得基因之间的序列基本上从这个数据库中获取。
AnimalTFDB:一个收录了动物转录因子和转录辅因子(transcription cofactors)信息的数据库。无论你是想了解转录因子的家族分类,还是想探索它们在基因表达调控中的作用,AnimalTFDB都能为你提供详尽的信息!
IFmut:一个最新发布的农业动物功能基因组数据库,它整合了猪、牛、羊和鸡四种常见农业动物共538个表观基因组数据集,提供65,124,531个候选基因组功能突变,为农业动物表观基因组研究者和基因组育种分子标记筛选提供有效的数据支撑。
在这里每天
更新基因检测的知识点
更多精彩内容
请扫描二维码
推 荐 阅 读