专家点评 Commun Biol︱华中师范大学张晓飞团队/浙江工业大学李会生合作开发面向空间转录组数据的空间域识别算法

学术   2024-11-01 00:00   上海  

来源︱姊妹号“岚翰生命科学”

撰文︱李会生
审阅︱张晓飞
点评︱靳水林(哈尔滨工业大学数学学院)
责编︱王思珍

组织中不同细胞类型的空间分布对理解复杂组织的生物功能和病理状态至关重要。近年来,随着空间转录测序技术的快速发展,空间转录组学因其能够同时提供细胞的基因表达水平与空间位置信息,为解析组织异质性和细胞间相互作用提供了有效手段。在空间转录组学数据分析中,识别在基因表达和组织形态学具有一致性的空间域仍是一个挑战。准确的空间域识别对于空间高变异基因选择和组织异质性解析等下游分析至关重要。


目前,针对空间转录组数据,已有多种空间聚类方法被提出用于识别组织中的空间域。然而,这些方法通常具有各自独特的假设和数据要求,导致所识别的空间域之间差异显著。此外,不同方法的性能也与所研究的组织结构复杂性相关。这些因素使得在复杂组织的空间转录组数据分析中,用户难以选择最优的空间聚类方法,从而妨碍了进一步解析复杂组织的空间结构。

20241021日,华中师范大学张晓飞教授团队与浙江工业大学李会生助理研究员合作在Communications Biology上发表了题为“Enhancing spatial domain detection in spatial transcriptomics with EnSDD”的研究论文。该研究通过整合多种空间聚类方法的结果,基于集成学习算法,提出了面向空间转录组数据的空间域识别方法。EnSDD的核心创新在于其动态加权机制,即在集成学习过程中优化各基础模型的贡献,且其贡献度可作为评价基本模型性能的指标。基于EnSDD识别出的空间域,EnSDD进一步实现了特定域的空间可变基因(domain-specific spatially variable genes, SVGs)的识别和细胞类型空间分布的解析。在应用于来自不同组织的真实空间转录组数据时,EnSDD显著提升了空间域识别的准确性,识别出具有域特异的空间可变基因,并揭示了特定空间域内细胞类型的富集模式。该研究为解析组织空间异质性和区域化提供了宝贵的见解。(拓展阅读:张晓飞课题组往期进展,详见“岚翰生命科学”报道(点击阅读)专家点评NAR︱张晓飞/陈洛南团队合作开发面向空间转录组的细胞类型与基因表达双重反卷积方法PANDA


EnSDD的整体流程如图1所示。其输入数据包括空间转录组数据的基因表达矩阵、空间位置坐标以及配对的组织形态图像(图1A。在方法核心部分,EnSDD首先获取多个空间聚类方法的结果。随后,根据每个方法的聚类结果,构建二元相似矩阵:若两个样本属于同一个空间域,则该矩阵元素为1,否则为0。通过这种方式,构建样本的相似性矩阵。基于这些相似性矩阵,EnSDD引入加权集成学习方法推断样本间的共识矩阵。最终,引入具有自适应分辨率的 Louvain 算法,在共识矩阵的基础上识别空间域(图1B。值得注意的是,EnSDD引入的加权集成学习方法能够自适应地为每个基方法分配权重,同时,这些权重可作为衡量基方法在特定数据集上性能的指标。

 1. EnSDD整体流程

尽管 EnSDD 的主要目标是识别组织中的空间域,它还整合现有方法深入探索组织的空间异质性(图 1C。了解组织区域的形成和功能需要研究富集在特定空间域的SVGsEnSDD 提供了两种 SVGs 识别方法:一种是通过假设检验,识别特定空间域的差异表达基因,另一种是引入Local Getis and Ord’s G指标,识别特定空间域内的表达模式与空间位置相关的基因。此外,EnSDD还融入了推断细胞类型空间分布的算法,为解析组织的复杂性和异质性提供了有效的工具。为方便用户使用,EnSDD提供了包含详细教程的R包和基于Shiny app开发的交互软件系统(图 1D


研究团队首先将EnSDD应用于人类背外侧前额皮质(human dorsolateral prefrontal cortex , DLPFC)组织多切片空间转录组数据,以评估EnSDD性能,并与其八种基本空间聚类方法进行比较(图 2。结果表明,EnSDD DLPFC数据集中识别空间域时表现出较高的鲁棒性和精确度。此外,分配给各个基方法的权重与其性能之间呈现出显著的正相关关系。值得注意的是,EnSDDDLPFC切片151669发现新的具有生物意义的子空间域,该空间域内的基因具有特异的表达模式。

2. EnSDD应用于DLPFC数据


随后,研究团队将 EnSDD应用于小鼠大脑、人类乳腺癌、前列腺癌和卵巢癌的空间转录组数据,以解析复杂组织的空间结构。研究结果表明,EnSDD能有效描绘癌症组织中的肿瘤内和肿瘤周围微环境。基于EnSDD识别的空间域,该研究深入刻画了侵袭性导管癌中的肿瘤免疫微环境,并探索了人类乳腺癌组织的肿瘤内异质性(图 3。值得注意的是,EnSDD成功在前列腺和卵巢癌组织中识别肿瘤生态区(ecotones),这些区域位于肿瘤与正常组织的边界处,表现出较高的肿瘤免疫多样性(图 4这些应用充分体现了 EnSDD能准确识别复杂组织的空间域,并基于这些识别的空间域有效解析复杂组织的空间结构。
 
3. EnSDD应用于人类乳腺癌组织
 
4. EnSDD应用于人类前列腺和卵巢组织


文章结论与讨论,启发与展望
EnSDD 提出了一种新颖的空间域识别方法,旨在通过空间域识别、域空间高变异基因识别以及细胞类型空间分布推断等工具,解析复杂组织的空间结构。其核心在于引入加权集成学习方法,实现自动化的空间域识别。通过应用于多个组织的空间转录组数据,结果表明 EnSDD 能有效发现新的具有生物意义的空间域,刻画复杂组织的空间微环境,展现出在解析复杂组织空间结构方面的卓越性能。


尽管 EnSDD在空间域识别方面取得了显著进展,但仍存在一些不足。首先,当前的方法设计主要针对单个组织切片,限制了其在多切片分析中的应用能力。这一限制可能导致对组织间共享特征和独特结构的遗漏。因此,未来将 EnSDD扩展到多切片分析不仅有助于提高检测准确性,还能更全面地揭示组织的动态变化和与疾病相关的亚结构。其次,整合多模态数据(如蛋白质数据、甲基化数据和染色质可及性数据)可能进一步提高空间域识别的准确性。当前的研究主要集中在单一类型的数据分析上,未能充分利用其它类型的数据来增强结果的可靠性。因此,未来的研究应这些多模态数据整合到 EnSDD框架中,以提高其性能和鲁棒性。


EnSDD 在空间域识别方面展现了重要的科学价值和应用潜力,尽管仍存在一些局限性,但为未来的研究方向提供了有益的启示和展望。


专  家  点  评

靳水林(教授,哈尔滨工业大学数学学院)


近年来,空间转录组学的发展为解析复杂组织的空间结构提供了有效的工具。尽管如此,识别基因表达与组织形态学一致的空间域仍面临诸多挑战。现有方法在这一领域内所识别的空间域一致性较低,且其效果往往高度依赖所研究的生物组织,这些局限性妨碍了研究者选择合适的空间域识别方法,进而影响对组织结构的深入理解。为了应对这一问题,华中师范大学张晓飞教授团队与浙江工业大学李会生助理研究员合作,提出了一种创新的空间域识别方法——EnSDD,成功克服了这一限制。


EnSDD基于集成学习,通过整合多种空间聚类结果,显著提升了空间域识别的准确性和鲁棒性。此外,基于EnSDD识别的空间域,该方法还提供了域特异的空间高变异基因识别和细胞类型空间分布推断等工具,以及一个集成R包和交互软件系统,为深入解析复杂组织的空间结构提供了全面的分析平台。


研究结果表明,EnSDD在人类和小鼠大脑和多种癌症(如乳腺癌、前列腺癌和卵巢癌)的空间转录组数据中展现了卓越的表现。该方法有效描绘了肿瘤微环境,深入分析了侵袭性导管癌的免疫微环境,尤其在前列腺和卵巢癌中识别了具有生物意义的肿瘤生态区,展示了肿瘤与正常组织边界处的免疫多样性。这些发现为理解细胞间相互作用和组织异质性提供了新的视角。


总之,EnSDD在空间域识别领域的贡献显著,提升了空间域识别的准确性,推动了空间转录组学分析的进一步发展,增强了对组织复杂性的理解,为复杂组织的研究提供了更强大的工具支持。

原文链接: https://www.nature.com/articles/s42003-024-07001-y


浙江工业大学数学科学学院助理研究员李会生和华中师范大学数学与统计学学院博士研究生谭雨婷为该论文的共同一作,华中师范大学数学与统计学学院张晓飞教授为该论文的通讯作者。该研究得到了国家自然科学基金、中央高校基本科研业务费、华中师范大学数学与统计学学院非线性分析及其应用教育部重点实验室的支持。



转载须知“岚翰生命科学”特邀稿件,且作者授权发布;本内容著作权归作者和“岚翰生命科学”共同所有;欢迎个人转发分享,未经授权禁止转载,违者必究。

     



     
【神经科学前沿技术培训系列】

【光遗传学与遗传编码钙探针和神经递质探针工作原理及应用】【在体成像技术在神经科学研究的基础与应用】(第八期)。时间 20241026-28(周六至周一);地点 南京

【脑片膜片钳记录系统的操作和应用】(第六期)。时间 2024126-8;地点 南通

【神经科学前沿技术整合:当在体电生理邂逅光遗传】(第一期),时间 2024119-11(周六至周一);地点 南京

全国前沿组织透明化与三维成像理论和技能培训班(第二期),时间 待定;地点 武汉

【疾病研究与动物行为学系列】

阿尔兹海默症最新研究进展和热点与动物行为学实验设计思路和数据分析(第一期。时间 20241027(星期天),地点 线上

“理论知识,操作技能,科研思维”

报名方式:15108204441(电话)Wang_Sizhen(微信)
(点击标题阅读全文)

岚翰生命科学群:文献学习
扫码添加微信,并备注:岚翰-文献-姓名-单位-研究领域-学位/职称
(注:不按要求格式备注,则不通过好友申请)


 
编辑︱王思珍
本文完


逻辑神经科学
以逻辑之学术思维,探索神经科学奥秘;汇百家争鸣,促求真明理。
 最新文章