NANO:一个新型的纳米抗体结构数据库系统

学术   2024-12-18 08:29   北京  


本文来源于生物信息学,2024,22(04):277-286。如有侵权,请联系删除。

纳米抗体是骆驼科动物中发现的抗体的一个亚类,其性能优越,现已在生物医学、食品科学等领域广泛应用。尽管纳米抗体序列和结构数据已十分庞大,但其来源的异质性和缺乏标准化阻碍了纳米抗体信息的收集。为了有效整合当前已公开的纳米抗体的庞大数据,本文建立了一个纳米抗体结构数据库系统NANO。该系统收集和存储了2160条纳米抗体的序列和结构信息,提供文本、序列、氨基酸分区等基本搜索功能以及物种、亲和力和序列长度等高级搜索功能。与其它现有数据库系统相比NANO系统在检索字段、检索功能覆盖和检索时间性能方面均表现出色。可应用于筛选或设计高亲和力的纳米抗体,促进新型纳米抗体特异性计算方案的开发。

【引言】

抗体是机体免疫系统在抗原刺激下由免疫细胞分泌的免疫球蛋白分子,能特异性识别和结合抗原。抗体广泛应用于疾病的诊断和治疗,尤其在癌症治疗领域取得了显著的成就。然而抗体分子较大,难以输送到靶点细胞。重链抗体(Heavy-chain antibodies,HCABs)只由两条重链组成,且重链缺乏CH1区,其结构如1b所示。由于缺乏CH1区,HCABs可以很快地从效应B细胞中分泌出去,及时发挥效应。由于不存在轻链,HCABs的抗原结合部位只有重链的可变区(Variable domain of the heavy chain,VHH)。单独克隆并表达出来的VHH结构具有与原重链抗体相当的结构稳定性以及与抗原的结合活性。VHH晶体为传统抗体大小的十分之一,是已知的可结合目标抗原的最小单位,因此也被称作纳米抗体(Nanobody,Nb),如1c所示。纳米抗体兼具传统抗体与小分子药物的优势,且具有比传统抗体更好的治疗特性,逐渐成为生物医药与临床诊断试剂中的新兴力量。纳米抗体的三维结构对其亲和力和治疗效果至关重要。药物研发需要参考大量纳米抗体序列和结构数据,但数据的异质性和缺乏标准化阻碍了信息收集。为整合公开的纳米抗体数据,有必要建立免疫信息学数据库。INDI数据库收集了多个来源的纳米抗体序列,但缺乏结构信息。本文所建立的NANO系统则收集了2160条纳米抗体序列及其结构信息,提供基本和高级搜索功能,旨在促进新型纳米抗体计算方案开发,推动纳米抗体在医疗和食品等领域的应用突破。

1.纳米抗体与其他抗体的对比

【主要内容】

1.现有的其它数据库

1.1 INDI

INDI数据库整理了来自多种公共渠道的纳米抗体,并配备了强大搜索功能。但INDI数据库的搜索结果只包含纳米抗体的序列信息,不包含其结构信息。

1.2 PDB

蛋白质数据库(Protein Data Bank,PDB)可以提供生物大分子的三维结构数据。PDB数据库中的纳米抗体信息主要涉及纳米抗体的结构与靶标的相互作用及在药物研发中的应用。但PDB数据库不是专门针对纳米抗体的结构数据库,纳米抗体信息在PDB数据库中也是作为复合物分子的一部分,若要单独检索纳米抗体并不方便。

1.3 NCBI

NCBI数据库中纳米抗体相关的信息非常丰富,包括了文献、序列和结构等方面的数据。但NCBI不是单独针对纳米抗体的数据库,虽然从NCBI数据库可检索到纳米抗体的氨基酸序列、基因序列测序序列和部分结构信息,但这些信息是分散的,没有以纳米抗体为中心关联起来。

1.4 SAbDab-nano

SAbDab-nano数据库包PDB编号、序列、抗原等方面的信息。用户可以通过多种方式检索纳米抗体结构信息,查看各种类型的纳米抗体结构信息。此外,其提供了一些分析工具,可以帮助用户分析和比较不同纳米抗体结构之间的差异和相似性。但是,该数据库不支持查看纳米抗体的氨基酸序列,按序列搜索出来的子集也包含非纳米抗体,且不包含抗体的核酸序列和亲和力数据。

2. NANO纳米抗体结构数据库系统的建立

首先收集了INDI、PDB、NCBI和SAbDab-nano等各公共数据库的纳米抗体公开资料,提取了所有纳米抗体序列的骨架区(Framework region,FR)、互补决定区(Complementarity determining region,CDR)、3D 坐标数据结构信息。经过严格的数据筛查与清洗,形成了比较全面的纳米抗体结构数据集。随后构建了基于MySQL的纳米抗体结构数据库,将数据集批处理导入数据库。在此基础上开发了一个访问纳米抗体结构数据的Web系统,前后端交互采用MVC设计模式,利用Django框架,实现了系统的浏览、抗体检索等核心功能,如2所示。

2.NANO数据库系统的数据浏览功能:(a)属性和序列信息;(b)结构信息

3.实验分析

为了检验NANO纳米抗体结构数据库的功能和性能,使用NANO进行了数据检索实验,并将实验结果与INDI、PDB、NCBI、SAbDab-nano等数据库系统进行了比较。

3.1 检索字段

INDI数据库包含超过1,140,894条纳米抗体信息,可通过PDB号查看详细结构文档元数据和序列信息。相比之下,本项目数据较少,但包含更多结构信息如分子名、亲和力、核酸序列等。PDB数据库收集生物大分子结构,包含纳米抗体数据,提供3D图和详细文档信息。本研究数据相比PDB增加了分子名、亲和力、核酸序列等信息。NCBI通过PDB号展示纳米抗体结构文档元数据和序列信息,本研究数据库则增加了分子号、核酸序列等数据。SAbDab-nano数据库提供多种检索方式,结果字段包括PDB编号、链标识符等,本研究数据库则增加了分子名、核酸序列等信息。

1.NANO与其他数据库系统检索结果的字段对比

3.2 索的功能覆盖

本文数据库与其他四种数据库的功能对比如2所示,可以看出,本文数据库在检索功能上覆盖较广,既有广泛所需的搜索方式,也有自己独特的检索功能,后续也将参考其他数据库特有的检索方式,丰富系统功能

2.NANO与其他数据库系统的功能对比

3.3 检索的时间性能

使用Chrome浏览器测试8个用例,比较搜索时间和结果。结果显示,NCBI搜索时间最长,PDB和SAbDab-nano次之,NANO最短。本文数据库在搜索效率上优势明显,除第7用例外,其它用例均耗时最短,且能准确匹配多种字段信息。INDI、PDB、NCBI搜索用例3-6无结果,可能因其不包括氨基酸序列和CDRH3区搜索。SAbDab-nano搜索用例4-6无结果,可能因未存储相关纳米抗体信息。总体而言,本文数据库在时间效率和功能多样性上占优,但数据存储量不如其他三大数据库,计划后续增加数据和功能覆盖。

3.数据检索测试用例

4.五个数据库系统在8个测试用例上的时间效率结果

3.NANO与其他数据库系统的全文搜索时间比较

【结论】

随着对纳米抗体的研究越来越深入,纳米抗体不仅能在医疗方面以及生物信息方面发挥极大的作用,在越来越多的新兴领域也展示出极高的应用价值。纳米抗体结构数据库系统NANO收集和存储了2160条纳米抗体的序列和结构信息,提供文本、序列、氨基酸分区等基本搜索以及物种、亲和力和序列长度等高级搜索功能。与其它现有数据库系统的比对实验表明,NANO系统在检索字段、检索功能覆盖和检索时间性能方面均表现出色。

该课题组计划将NANO系统应用于抗黄曲霉毒素纳米抗体的编辑和制备,以提高其亲和力。并将导入更多数据源的纳米抗体序列数据和可靠的结构预测数据,以增强NANO纳米抗体结构数据库系统的实用性。

【原文出处】

秦浥雯,张嘉仪,吴朝敏,等.NANO:一个新型的纳米抗体结构数据库系统[J].生物信息学,2024,22(04):277-286.

指导教师:王战辉

抗体故事分享基于抗体的分析方法研究进展,欢迎投稿! 

点击下方名片,轻松关注!




 

抗体故事
分享中国农业大学沈建忠院士团队王战辉教授动物源食品安全课题组抗菌药物、环境污染物、激素等小分子化合物半抗原设计、抗体发现和进化、免疫传感原理和构建、检测技术及产品研发等研究进展。联系方式:zhanhui.wang@foxmail.co
 最新文章